CRFs模型面向情感分析的领域知识库构建研究(2)
时间:2017-06-12 21:51 来源:毕业论文 作者:毕业论文 点击:次
购买者都希望买到物美价廉的东西,喜欢借鉴别人的购买意见,因此商品评论成为购买者的关注热点。但是在网络上对某个商品的评论分布广泛并且数量大到惊人,购买者不能浏览所有的信息,也就不能做出相对客观的决定。因此人们开始研究商品评论挖掘即对评论的倾向性分析——通过意见挖掘(opinion mining)技术可以自动识别并获取其中有价值的商品评论,并对获取的商品评论进行情感倾向性分析。这些有价值的信息可以帮助购买者选择满意的商品,同时也可以让企业了解到购买者对商品的态度,了解他们对商品的实际需求,有助于商品的改进提高企业竞争力,帮助企业从众多竞争者中脱颖而出。 1.1 研究背景 网络商品评论中包含了用户对产品的性能或功能等方面持有肯定/否定的态度,它们可以帮助其他用户在购买产品之前了解已经购买了该产品的用户关于该产品的使用体验,因此,商品评论成为了人们关注的热点。同时中文商品评论的倾向性分析也成为学术研究的一个热点和难点。已有大量学者对其展开了研究,并且已经取得了一些成果,但是由于中文本身的特性以及评论者表达的随意性,使得当前的研究在评论对象和评价词自动抽取上的准确率和召回率不高,商品评论情感极性分类精度不高等问题。 1.2 研究意义 知识库是对领域信息的模型化表示。利用本体构建知识库已经成为当前的研究热点。近年来,本体已经在知识工程、人工智能、语义网等相关领域得到了广泛关注和深入研究,被广泛应用以解决通信、异构环境互操作和系统工程中的知识重用和共享、知识获取和系统集成等问题。 建立中文商品评论的知识库可以根据知识库的推理执行规则,提高评论情感倾向判断的准确率。 该项研究可以应用到现实生活的许多方面,包括: 帮助消费者做出正确的购买商品的决定。该项目可以为消费者提供已购买者对商品及商品某个特征的总体评价,帮助消费者更好的了解商品的实际效用,理性的选购商品。 帮助企业/商家了解购买者的需求并制定产品策略。该项目可以使企业实时的了解顾客对商品的态度及评价,以改进商品的质量和企业的服务态度,这将极大的提高企业电子商务交易量和顾客满意度。更进一步地,通过对不同时期顾客对商品评价的褒贬情感跟踪分析,分析用户的关注程度,以便制订合适的产品销售策略。 2 本体理论及其应用 2.1 本体概念 本体(Ontology)最早源于哲学范畴,用于描述客观事实的一个抽象本质,是客观存在的一个系统的解释或说明。后被用于研究实体的存在性和存在本质等方面的通用理论。在人工智能界,最早给出Ontology定义的是Neches等人,他们将本体定义为“给出构成相关领域词汇的基本术语和关系,以及利用这些术语和关系构成的规定这些词汇外延的规则的定义”。Neches认为:“本体定义了组成主题领域的词汇表的基本术语及其关系,以及结合这些术语和关系来定义词汇表外延的规则。”[ ]随着本体在信息检索、知识系统等领域的应用,研究本体的人也越来越多,并给出了不同的定义,其中人们普遍接受、引用率较高的本体定义是Gruber于1993年提出的“本体是对共享的概念化进行形式的显式规范说明” [ ]。其中,“概念化(conceptualization)”是客观世界现象的抽象模型,要明确标识与现象相关的概念;“明确(explicit)”是概念及概念与概念间的联系有明确的定义;“形式(formal)”是指本体应该是机器可读的;“共享(share)”是反映本体中的知识是使用者一致认可的,领域公用的。 (责任编辑:qin) |