3.2.2 实验验证 16
3.2.3 实验总结 20
4 基于情感分析的微博话题突变识别 21
4.1 话题突变识别方法 21
4.1.1 研究思路及方法 21
4.1.2 话题演化中的情感变化 21
4.1.3 话题突变识别指标及方法 21
4.2 实验分析 22
4.2.1 工具介绍—独到 22
4.2.2 实验验证 23
4.2.3 实验总结 28
5 结论与展望 29
5.1 研究结论 29
5.2 研究不足 29
5.3 研究展望 29
致 谢 30
参考文献 31
1 引言
1.1 研究背景
微博这一新兴媒体近年来得到了飞速发展,成为当前十分流行的综合性社交平台,并在社会网络舆情中充当着愈加重要的角色。微博用户借助该平台可以更加方便快捷地浏览到各种信息,还能即时分享和评论自己感兴趣的内容,促进了信息的进一步传播。同时微博用户还能随时随地和好友以及自己关注或者关注自己的其他微博用户一起交流谈论,分享各自的观点。微博服务现已风靡世界,不同地区有着各自代表性的微博平台,如Twitter是国外尤其一些欧美国家比较受欢迎的微博服务,而在国内比较盛行微博服务平台主要是由一些门户网站所开发,如新浪、腾讯、搜狐和网易。据目前国内相关部统部门的统计,光注册成为新浪微博用户的人数在2013年的上半年就已达到5.36亿,而注册腾讯微博的用户数早在2012年就已达到5.07亿。毫无疑问,微博已经在中国网民的网络活动中占据十分重要的地位,可以看出越来越多的的网络舆情通过微博进行传播。因此,在这个重视研究社会网络舆情的今天,关注微博舆情在现在这个十分重视加强社会网络舆情研究的大环境下的显得越来越有意义。
1.2 研究意义
微博舆情在社会网络舆情中具有举足轻重的地位,通过对海量的微博数据进行挖掘,及时归纳分析微博中的突变事件,帮助我们掌握目前社会网络中比较流行的突发话题。一方面有助于帮助用户获取自己感兴趣的话题,了解实时的突发事件动态,另一方面有助于相关部门掌握舆论动态和发展趋势,利于其加强及时监测,实现有效管理,正确引导舆论走势。由此可见,深入研究微博话题突变识别技术具有十分重要且实际的意义。
1.3 研究内容
本文基于微博话题突变识别的主题,重点研究微博舆情中的话题识别、话题演化及演化过程中的话题突变的方面的相关内容,并对微博的本质和特征进行一定的分析,结合其特点,设计出两种简单的微博突发话题识别方法,同时结合相关实验进行对比分析验证。
2 国内外研究现状
2.1 话题识别与追踪
话题识别与追踪(TDT)主要是把与话题相关的纷繁复杂的信息内容加以汇总和归纳,用户能够借助它了解某个话题中不同相关因素之间的联系,从而整体掌握话题的各种相关内容以及其与其他话题之间的关系[1]。目前,话题识别与追踪的相关技术已取得较大进步,研究范围也随之不断扩大,对象不再仅限于媒体信息,已日趋深入到与信息相关的各种领域,且应用广泛。
2.1.1 基本概念解释
不同于以往相关技术中处理的文本都是静态和封闭性的,话题识别与追踪技术中的处理对象通常都是动态变化的,且一般根据时间变化。与语言学上的相关概念不同,话题识别与追踪中的一些常用概念与语言学中的相关概念不同,具有如下定义[2]: 新浪微博中的话题突变识别与分析研究(2):http://www.youerw.com/xinwen/lunwen_18937.html