3。3。3 “用户-所属观点主题”2-模网络 16
3。3。4 基于“用户-所属观点主题”网络的观点支持度分析 17
4。微博舆情观点主题发现实验 17
4。1。微博舆情数据的收集与处理 17
4。2舆情网络的构建实现 18
4。2。1网络数据文件编辑 18
4。2。2 舆情网络可视化 20
4。3基于LDA模型的微博舆情观点主题抽取 24
4。3。1 LDA模型java包的使用 25
4。3。2实验数据预处理 27
4。3。3 输入文档构建 28
4。3。4 LDA模型主题特征词抽取 28
4。3。5 微博舆情观点主题总结 29
4。3。6 LDA模型主题发现结果评价 30
4。4 基于LDA模型的文本聚类 31
4。4。1微博观点主题聚类 31
4。4。2文本聚类结果评价 33
4。5微博观点主题演化分析 34
4。5。1 用户-所属观点主题的可视化 35
4。5。2基于节点入度的观点主题支持度分析 38
4。5。3 观点演化分析 39
5。总结和展望 42
5。1研究结论 42
5。2研究不足及展望 43
致 谢 45
参 考 文 献 46
1。绪论
1。1研究背景及研究意义
1。1。1研究背景
Web2。0技术的发展与普及改变了人们的交流方式,越来越多的用户选择论坛、贴吧、博客、微博等自媒体平台实时发布、传播消息,分享个人经验与观点,并通过回复、转发等方式与其他用户进行信息的交流。总也在8·19讲话中指出,“要把网上舆论工作作为宣传思想工作的重中之重来抓。”网络舆情作为社会舆情在互联网上的延伸,已受到各级政机关、企事业单位的关注与重视。
首先,由网络引起、放大或主导的社会舆情事件频发。由于互联网具有信息发布及时、传播速度快、影响范围广等特性,导致舆情事件一旦在互联网上爆发将呈不可逆转的趋势。随着移动互联技术的不断发展,越来越多的用户习惯通过手机畅所欲言,实时发布身边的所见所闻,这就导致越来越多的舆情事件不再是通过媒体的报道而进入人们视线,而是通过个人的发布及网友的关注成为舆论热点。如2016年4月5日,某网友借助微博寻求帮助,曝光了其在北京某酒店遭陌生男子劫持的监控视频,该微博一经发出立刻引起网民强烈关注,百万条相关微博铺天盖地而来,该事件在一夜之间占据微博热搜排行榜第一。
其次,网络的开放性和隐蔽性为网民提供了观点表达的场所,舆情事件面前人人都有发表自己观点、看法的话语权。面对海量的带有观点倾向的网络舆情信息,如何从中快速把握当下网络舆情参与主体所持有的主要观点,做好舆情引导工作,对政府和企业提出了更高的要求。而且关于网络舆情的现有研究更多是根据网络舆情发展结果进行滞后性的动因分析、回溯分析、演化分析,其处理方式一直处于被动的问题解决状态,不能满足政府和企业应急管理中实时监测舆情动态的现实要求。如果政府和企业能够在网络舆情散播阶段演化为集聚阶段的“爆发”临界点、聚集阶段过渡到热议阶段的“升华”临界点,进行不良舆情观点的主题发现,进行有效的应急管理,就可以发挥其前瞻性和引导性,掌握网络舆情引导的主动权。