面向电商平台商品评论的比较句挖掘算法(2)
时间:2019-03-02 14:44 来源:毕业论文 作者:毕业论文 点击:次
参考文献 26 1 绪 论 1.1研究背景及意义 随着互联网的普及和深入发展,电子商务以一种全新的经济方式在全国兴起,并得到了迅猛发展。淘宝、京东、亚马逊、当当等这些网站逐渐进入了人们的日常生活。网络使人们更乐于在这些平台上发表和交流意见,同类产品的论坛、微博等社交平台上涌现了大量的产品评论。本文的选题“面向电商商品评论的比较句挖掘算法”以比较句识别和要素抽取作为切入点,利用自然语言处理技术来研究比较句相关的问题,将方法应用到实际的电商评论领域来进行检验。 作为一种极具说服力的表达方式,比较句在评论中的比例大约占10%。比较句表达了人们对于不同事物之间的优劣或者异同点的看法。日常生活中,人们不断的在用比较来表达自己的观点。随着Web2.0的深入发展,许多论坛、博客、文基等新型网络元素兴起,网络信息更加个性化。对于电商平台而言,个性化的评论带来了多样化的信息。普通消费者希望通过从网站上其他人的评论信息中获取到对自己有价值的方面。同类产品的比较评论就显得尤为重要。不同于一般的观点句,比较句具有“平比、差比、极比”三种表达句式,包含了丰富的有价值信息,更具挖掘价值和可信度。如果能过通过自动识别用户评论的比较句,并且从中抽取出“比较主体,比较客体,比较属性,比较结果”四个要素,形成有价值且直观的信息传达给企业和消费者。这样既可以帮助生产商家认识到自己产品以及竞争产品的的优劣,用户的需求等信息,从而制定更好的生产策略用于改进下一代产品,以及制定相应的推销策略以赢得更大的市场份额,提升自身竞争力。又可以让普通消费者能够迅速了解到其他用户的产品使用体验,以便做出合理的购买决定。 虽然目前比较句识别和要素抽取技术还处于研究阶段,但是随着自然语言处理技术的不断成熟化,这项研究一定能够得到广泛推广和应用。 1.2国内外研究现状 1.3本文的主要研究内容 (1)基于规则的汉语比较句识别方法 比较句是一种评论中比较常见的表达方式,比较句的计算机自动化识别是研究比较句的一项重要内容。本文根据比较句的特点,从大量的语料中进行总结得到比较词词典和比较规则模板库,用其直接与待识别句子进行匹配,完成该识别任务。 (2)基于规则和分词的比较句要素抽取 比较句要素抽取可以反映出比较主体和客体在比较属性上的优劣,有着重要作用。本文通过比较规则库获得比较句,再通过分词工具进行分词以及词性标注,确定比较词和比较结果词的位置;然后再获取比较词之前、比较词和比较结果词之间的名词,并将其跟领域产品名表进行匹配,进而抽取出比较要素。 1.4本文的组织结构 本文共分 章内容。 第一章 绪论 介绍了本论文的研究背景及选题意义,比较句识别及要素抽取的国内外研究现状,本文的主要研究内容和组织结构。 第二章 介绍比较句识别与要素抽取的基础任务、技术方法与评价指标 第三章 通过规则化方法,来完成汉语比较句的识别 第四章 通过规则化和分词的方法完成比较句的要素抽取 第五章 全文的总结及以后工作展望 2 比较句识别与要素抽取的基础任务、技术方法与评价指标 首先介绍一些比较句相关的基本概念(例如比较句定义、类型、比较要素等),同时在实验初期进行了数据资源的准备工作,例如比较词词典和比较规则模板库的构建,在此进行说明。 (责任编辑:qin) |