A.准备数据:即将分词结果和积极以及消极词典分别存入数组。
B.分析数据:即将分词结果中的词在情感词典中所占有的比例。
(3)分析结果
论文中采用的以Qt为GUI框架的开源库,QCustomplot作为二维图的描画方式,论文中主要研究了此开源库的使用方法和有点介绍。
1。6 论文的组织结构
第一章 绪论
这部分主要包括本设计的研究背景和意义,并介绍了国内外在文本分析方面的研究现状,还介绍了所用到的系统开发工具,最后介绍了本设计所研究的主要内容。
第二章 相关内容介绍与理论概述
这一部分主要介绍了新闻的定义和发展,分析了新闻文本在研究中所面临的困难,以及介绍了文本预处理技术。
第三章 需求分析以及总体设计
这一部分主要是对软件的需求进行了分析,并应对分析做出总体的设计UI说明以及设计方案的描述。
第四章 详细设计
这一章主要是叙述了,详细的设计接口说明,并对部分代码进行了举例说明。
第五章 实验结果与分析
本章主要展示实验结果并进行相关的叙述。
第六章 全文总结与展望
本章主要对本文的工作进行总结,分析不足之处,以及需要完善的工作。
2 相关内容介绍与理论概述
2。1 新闻相关概述
2。1。1 新闻定义及发展
新闻的英文名叫News。它是通过报纸、电视、互联网等媒体途径进行信息传播的。新闻分为广义和狭义,广义方面:在报刊、电视、广播上发表的评论以及消息、通讯、速写等都属于新闻;狭义方面的新闻就是指消息,因为它能够通过简明的文字及时地报道出最近发生的有意义的事情。
1943年,陆定一提出:“新闻的定义,就是新近发生事实的报道。”甘惜分教授在1981年对陆定一提出的新闻定义提出了质疑。甘教授认为“新闻是报道或评述最新的重要事实以影响舆论的一种特殊手段。”这一定义与陆定一所提出的新闻定义相比较,其加了“评述”二字,将新闻评论也划入到新闻的范畴中。在2004年,郑保卫教授认为:“新闻是公众关注的最新事实信息的报道。”郑教授对新闻的定义与西方大多数的新闻定义是一样的强调了尊重群众。以上对新闻的定义都是跟随着时代的发展和思想的进步前进。
2。1。2 新闻文本研究中的困难
1。新闻文本的自身特点
随着网络科技的快速发展,传播新闻的方式也在不断地涌现出来。下面主要介绍两个方面的新闻文本的特征。第一个:广播电视新闻的文本特征;第二个:网络新闻的文本特征;广播电视新闻文本具有自己的特殊性,其传播速度快、范围广、简短;很多的新闻报道在广播中占用的时间在30-40秒之间。网络新闻时效性强,更新速度快;它与传统媒体相比较,网络新闻时效性是根据小时来计算的。网络新闻具有很强的交互性,人们可以将自己的所见所感发表在网络上,并且有选择的获取信息。网络新闻文本存在很大的差异性,主要指新闻文本标题与其内容联系不紧密;存在口语化比较严重、语句不规范等问题,这给情感分析带来了很大的难度。
2。情感词典的构建
汉语中,相同的词语所在不相同的语境中表达的情感是不同的,对情感倾向的判断带来了困难,这使得构建一个适用于新闻文本的情感词典是一个难点。
3。新闻文本的数据获取