摘要本论文提出了一种基于Hownet的情感词典构建的方法,并在此基础上,进行了文本中所包含的情感信息的识别。《知网》是一个以汉语和英语的词语所代表的概念为描述对象,以揭示概念与概念之间以及概念所具有的属性之间的关系为基本内容的常识知识库。在情感词典的建设中,首先根据目前情感分类发展的现状,以及知网中所包含的情感信息,确定了情感分类体系。然后根据Hownet的内部结构以及概念、义元之间的关系,借助手工标注建立起情感词典,并收录了数码相机领域情感词对词典进行了扩充。10261
关键词 《知网》 情感词典 情感词 评论词储存
毕 业 论 文 外 文 摘 要
Title Research on the Emotional thesaurus Base of Hownet
Abstract
This paper presents a novel way for building an emotional thesaurus based on Hownet, which is an on-line common sense knowledge base unveiling inter-conceptual relations and inter-attribute relations of concepts as connoting in lexicons of Chinese and their English equivalents, and using the emotional thesaurus makes some research on emotional information recognition of Chinese text. In the process of building the emotional thesaurus, first, according to the current development of emotion classification system is confirmed. Then according to the inside structure of Hownet and inter-conceptual relations and inter-sememe relations of Hownet, with the help of manual tagging, the emotional thesaurus is built, through collecting emotional information to make the emotional thesaurus be extended.
Keywords Hownet, Emotional thesaurus, Emotional information, Comment storage
目录
1 绪论 1
1.1研究背景及意义 1
1.2国内词典的相关研究 2
1.2.1《知网》 2
1.2.2同义词词林 3
1.3 国外的相关研究 4
1.4本文的主要工作与论文的组织结构 6
2 Hownet详细介绍 6
2.1概述 6
2.2Hownet中的“概念”和“义原” 7
2.3Hownet的知识描述语言 9
2.4 Hownet的记录样式 10
2.5基于Hownet的应用 10
3情感词典的构建 10
3.1 对Hownet中情感词的转换 10
3.1.1 Hownet情感词的简介 11
3.1.2生僻字处理 11
3.1.3基础情感词和修饰词的获取 12
3.1.4基础情感词的词性标注 13
3.1.5转折递进关系的设置 14
3.2数码相机领域的情感词的添加 14
3.2.1数码相机领域评论的抓取 14
3.2.2情感词的获取 15
4 情感词典的显示 19
4.1单句中情感词的显示 19
4.1.1查询功能 20
4.2.2输入功能 21
4.2复句情感词的显示 22
4.2.1查询功能 22
4.2.2输入功能 23
5总结与展望 24
5.1总结 24
5.2展望 24
致谢 25
参考文献 26
1 绪论
1.1研究背景及意义
随着网络技术的迅猛发展,已成为越来越多的人们获取信息的重要来源,同时也是人们表达自己观点和情感的平台,其表现形式大多是非结构化的评论,那么如何提取出有价值的信息为己用,这是一个相当困难、复杂的工作。面对浩如烟海的论坛、博客以及网站的评论信息,如何判断笔者的观点和情感,是一个值得研究的课题。情感分析有着广泛的应用前景。近几年,它已经成为自然语言处理中的一个热点问题。并且在市场预测分析、民意调查、智能导购、大众评论等诸多领域有着广阔的应用空间和发展前景。