LibSVM面向数码领域的垃圾评论信息的识别研究(3)
时间:2017-06-15 19:48 来源:毕业论文 作者:毕业论文 点击:次
1.3 垃圾评论识别研究现状 1.3.1 垃圾评论识别方法的研究现状 1.4 本文的主要研究内容与技术路线 1.4.1 本文主要研究内容 本文以网络上的评论信息作为研究对象,讨论了评论的发表动机;之后从信息的有用性角度,对评论信息进行详细的分类。通过对目前的垃圾评论识别的方法进行深入的分析,了解各种方法所存在的问题。本文主要使用SVM算法,结合LibSVM工具,对抓取的评论信息进行二类的分类,从而提高对评论识别的准确率。本文的主要结构安排如下: 首先是绪论,介绍本文的研究背景,垃圾评论的定义与分类,以及与网页垃圾、垃圾邮件的相似之处与不同之处,研究的意义。并概括性的介绍和分析了垃圾评论识别的研究现状。 接着分析了评论信息发表的动机,对评论的发表者进行了分类,之后依据信息有用性的准则,对商品评论进行了详细的分类。 其次是对SVM算法的简单介绍,同时也概括性的介绍了LibSVM这一工具。 之后设计实验,对评论信息进行转换,结合LibSVM工具实现商品评论信息的二类分类,并对三种核函数的分类结果进行对比,选择效果好的核函数进行参数优化,从而优化识别的结果。 最后对全文做出总结和展望。 1.4.2 主要技术路线 本文以数码领域中相机的评论信息为研究对象,依据一定的准则对商品评论进行详细的分类。再借助于商品评论信息的抓取软件,对评论信息进行收集、整理、加工、建立语料库。之后选取特征,构建与相机相关的词典,使用SVM模型,借助于LibSVM工具进行评论信息的分类,其技术路线如图1.2所示: 图1.2 研究的技术路线 2 评论信息分析 2.1 评论发表动机分析 随着互联网的迅猛发展,评论信息几乎在各大网站上都随处可见。但是这些评论的发表者的目的确各种各样。本文通过对相关文献的阅读,总结了评论发表的动机。用户发表产品评论的动机大概有八种,分别是:情感分享、娱乐放松、信任平台、支持平台/商家、惩罚平台/商家、信息回报、经济回报、提升消费质量[20]。又可以将上述的动机归为情感需求动机、利益驱动两大类。 (1)情感需求动机 情感需求是指为了满足自身的情感而发表的评论。与情感相关的动机主要有以下几个方面:①自我表现或发泄个人情绪。比如:一些用户只是为了炫耀自己或者是为了展现自己,来得到其他人的认同而发表评论。或者单纯表达自己的个人情绪与购物、产品无关。②表达自己的情感,支持/惩罚商家带给自己的感受,与购物相关。 (2)利益驱动动机 利益需求是指为了满足个人或者集体利益而发表的评论。与利益相关的动机主要有以下几个方面:①寻求解决方案。比如:自己在购买或者使用产品时,遇到的问题,通过评论的方式来试图求助,得到解决方法。②经济回报。比如:通过发表评论而期望得到商品的折扣、商家或者平台的奖励。③增强个人体验。比如:通过发表评论使的商家的商品质量和服务得到提高,网络购物平台的服务更加完善。 2.2 信息的有用性准则 周三多教授在其《管理学原理》一书中将有用信息的特征进行了详细的分析。本节就有用的信息各方面的特征进行详细的阐述。 有用信息的特征一般来说指的是这三个方面[21]:⑴高质量的;⑵及时的;⑶完全的和相关的。也就是说,有用的信息首先必须是质量较高的;其次,必须是及时的,当管理者需要时就能获得;最后,必须是完全的和相关的。具体如表2.1所示: (责任编辑:qin) |