(2)实验的评测标准
对垃圾评论的识别实际上是对评论进行分类,所以本文采用了文本分类分类器中最常用的评测指标——准确率(Precision)、召回率(Recall)和 。利用这些指标分别对垃圾评论和非垃圾评论的识别效果进行对比和评价,以此证明本文所提方法的有效性。准确率和召回率的计算方法如下:
但是对于一个模型来说,召回率和准确率不可能两全其美:召回率高时,准确率低,准确高时,召回率低[33]。因此,同时采取了两者的结合 来进行评估, 的值越高,证明模型的效果越好。
综上所述,本文的具体的实验思路总结如图3.2所示。 LibSVM面向数码领域的垃圾评论信息的识别研究(8):http://www.youerw.com/jisuanji/lunwen_9205.html