再次,用户在微博、贴吧等自媒体网络平台发布的信息具有数据类型多样化、文本内容碎片化与不完备的特性,使得传统的舆情事件研究方法不能满足现有网络舆情分析的需要。因此网络舆情的研究方法需要得到进一步的创新,在文本内容处理的基础上,重视用户行为、用户关系等社会化特征数据,多维度地挖掘网络舆情中的主题。
基于以上研究背景,本文将基于社会网络视角,利用LDA主题模型,引入时间变量,动态发现网络舆情参与主体观点主题的变化,以期为政府和企业的网络舆情监测和引导提供理论支持,满足关键舆情的事前跟踪和事中实时发现的需求。
1。1。2研究意义及应用前景
(1)理论意义
传统的主题发现方法是静态的、基于局部网络舆情信息的单纯的文本分析,网络舆情应急管理实践需要充分考虑融合用户行为和网络情境的动态主题发现和多维分析,本文的研究为网络舆情主题发现研究提供了更深化的探索,不仅为图书情报学的发展和实际管理需求相结合提供了新思路,这对于丰富图书情报学在大数据分析技术落地应用、面向情境的文本挖掘应用方面有着开拓性的理论意义,也为日益繁荣的网络舆情研究提供了增量性成果。
(2)实际应用价值
首先,本文基于社会网络视角,结合主题发现模型对网络舆情观点主题进行多维度、深层次挖掘,突破当前网络舆情监测研究的单维度视角,满足用户的不同需求;再次,本文能够实现对网络舆情观点主题演化过程的有效预测、监控,有助于企业准确预见可能形成关注效应的商机或危机,帮助企业进行企业品牌与网络媒体、口碑、网络竞争环境、促销活动分析;有助于政府在网络舆情发展的集聚阶段把握舆论走向,抢在舆情发展的热议和流行阶段,针对网民的意见诉求,加以科学应对和有效引导。
1。2研究现状
1。2。2网络舆情主题发现研究现状
1。3研究内容与研究方法
1。3。1研究内容与技术路线
全文共分为五个章节,各章节主要内容如下。
第一章绪论部分,阐明了本次研究的背景及研究意义,通过对网络舆情关键技术和网络舆情主题发现的研究现状进行分析与总结,提出了本文的研究内容、技术路线和研究方法;
第二章相关理论基础研究部分,在对已有概念理解的基础上,给出了本文对“观点主题发现”、“观点主题”的定义,并对主题发现的实现方法及本文所要用到的LDA主题模型和社会网络分析方法进行了详细介绍,为此次研究奠定了坚实的理论基础;
第三章通过舆情信息内容、用户关系、用户行为三个方面的四个维度(时间维/用户维/内容维/观点维)的关联,构建网络舆情观点主题发现方法体系,提出了整体的框架模型;
第四章微博舆情观点主题发现实验部分,该部分是本文的重点。首先是舆情社会网络的构建,选取新浪微博上关于“双汇进口美国猪肉”事件的微博及评论为研究对象,实现了对第三章中提出的网络模型的可视化;其次,选择JAVA版本的LDA模型,实现了对“双汇进口美国猪肉”事件相关微博及评论集合的主题抽取,经人工总结得到参与该事件的网民主体每天的观点主题;同时利用LDA模型直接聚类的方法,得到了微博与其所属观点的对应关系;最后基于上述聚类结果,以用户和所属观点为节点,构建了“用户-所属观点”2-模网络,并利用社会网络分析软件Pajek实现了该网络的可视化,从社会网络的角度分析了“双汇进口美国猪肉”事件参与主体观点主题随时间推移的变化情况; Pajek社会网络分析的网络舆情观点主题发现研究(4):http://www.youerw.com/xinwen/lunwen_99450.html