LibSVM面向数码领域的垃圾评论信息的识别研究(4)_毕业论文

毕业论文移动版

毕业论文 > 计算机论文 >

LibSVM面向数码领域的垃圾评论信息的识别研究(4)


表2.1 有用信息的特征
高 质 量    及   时    完   全
    精确
    清楚
    有序
    媒介        时间敏感性
    例外报告
    当前
    频繁        范围
    简洁
    详细
    相关
高质量:质量是有用信息最重要的特征。质量方面的要求又可细分为以下几个方面。首先,高质量的信息必须是精确的。清楚是高质量的信息的另一要求。另外,高质量的信息式排列有序的,而不是杂乱无章的。最后,信息传递的媒介对质量有重要影响。
及时:及时的信息有以下几方面的要求。用户一有需要就能获得信息,是对及时的信息的首要要求。其次,信息反映当前情况。
完全:信息想要有助于用户,它必须是完全的。信息的完全性也有接个方面的具体要求。首先,信息的范围必须足够广泛,可以全面地了解现状。其次是简洁和详细。信息应该以最简洁的方式呈现给用户,同时也应该尽可能详细,使用户对现状有一定深度和广度的了解。
2.3     基于有用性的评论信息分类
简单的来说,对于消费者而言,产品评论信息对消费者的购买决策有相当大的影响,因此产品评论信息是否有用成为了一个有效的分类标准。
依据信息的有用性的特征将产品评论信息分为以下几类:
(1)有用的评论信息
依据有用信息的特征,我们将有用的产品评论信息定义为用户发表的产品评论信息是完全与该产品相关的,真实的、公正的观点,可以帮助其他用户购买决策起到辅助作用。
依据有用的评论信息的特征,可以将其具体分类为以下几类:
①不完整的评论信息:用户发表的评论信息没有完整的表达出自己的态度,比如只是描述了产品的某些特点,却没有表达出自己的观点。比如:“分辨率是1024*365”。
②半相关的评论信息:此类评论信息是指在评论中提到了一部分的产品信息,但是评论大篇幅在描述无关的信息。
③简略的评论信息:此类是指仅用简单的几个正面或者负面的词语来描述产品,没有详细的说明,而且指代对象很不明确。如:“速度真快”。
④高质量的评论信息;此类的评论信息指的是那些评论的内容精确,能够完全表达出自己对产品的看法,是完全相关的。
(2)无用的评论信息
无用的评论信息主要是指商品评论信息低质量,对于消费者来说,没有任何作用,甚至可能会误导消费者。
 1)虚假评论信息
①推销信息:推销信息是指造假者为了推销自己的商品,提高销量,采取虚假的方式,自己或者请一些专业造假者对想要推销的一个或多个目标商品进行夸大的,不切合实际的正面评价。
②诋毁信息:诋毁信息是指造假者为了给自己带来商业利益和名望,选择从竞争对手入手,撰写大量的错误、负面的评论信息来诋毁目标商品。
③干扰信息:干扰信息是指发布广告、链接等与商品毫不相关甚至错误的信息,来干扰读者或者误导自动观点挖掘系统
④无意义信息:无意义信息是指发布一些内容不完整、空洞的、甚至毫无意义的评论信息,或者是单纯宣泄自己的情绪的语句,如:“好”、“沙发”、“喜欢”等。
2)系统评论信息
系统评论是指由于用户未及时评论,由系统自身默认的给出评论,这类评论不属于虚假评论,但是对用户没有任何作用。 (责任编辑:qin)