毕业论文

当前位置: 毕业论文 > 研究现状 >

社会舆情主题研究现状概况

时间:2018-12-10 20:34来源:毕业论文
社会舆情的发展与监控对社会安定和政府决策都具有重要意义。由于社会及网络的发展,人们对社会事件、政府政策等的关注度、参与度都大幅提升,一件小的事件都可能经过传播被无
打赏

社会舆情的发展与监控对社会安定和政府决策都具有重要意义。由于社会及网络的发展,人们对社会事件、政府政策等的关注度、参与度都大幅提升,一件小的事件都可能经过传播被无限放大,产生社会舆情。近年来,社会上开始关注、研究社会舆情,而主题研究是社会舆情研究中的一大热点,并且已有一定的研究成果。接下来将从社交媒体主题研究和新闻主题研究两方面来介绍社会舆情主题研究现状。31383
1 社交媒体主题研究现状
社交媒体(social media)是指允许人们撰写、分享、评价、讨论、相互沟通的网站和技术,是用户用来分享意见、观点、见解等的工具和平台,具有社会交往和媒体两方面的特性。社交媒体已有几十年的发展历史,可追溯到1971年的第一封邮件,甚至可追溯到二十世纪五十年代的电话时代。而直到90年代,随着计算机与互联网的迅速发展,社交媒体才得以广泛发展,尤其是Web2.0兴起后,社交媒体成为我们生活中不可忽视的媒体力量。具体来说,常用的社交媒体的种类有:博客及微博客(Twitter、新浪微博)、百科(Wiki、百度百科)、图片分享(Flickr)、播客及视频分享(YouTube、土豆网)、论坛(天涯)、社交网络(Facebook、开心网)和网络社区(猫扑)等[1]。论文网
目前,国内外将对社交媒体的主题研究的焦点放在主题发现方面。文本主题发现一般分为基于统计的文本发现和基于语义的文本发现,基于语义的LDA主题模型的是大部分研究的基础[2]。LDA( Latent Dirichlet Allocation)主题模型由Blei在2003年提出,在概率隐性语义索引( probabilistic Latent Semantic Indexing,pLSI)上扩展得到的概率生成模型,具有词层、主题层和文档层三层贝叶斯结构[3],基本思想是把文档看成其隐含主题的混合,而每个主题则表现为跟该主题相关的词项的概率分布,LDA可以用来识别大规模文档集或语料库中潜在的主题信息。LDA基于词袋(bag of words)模型,认为文档和单词都是可交换的,忽略单词在文档中的顺序和文档在语料库中的顺序,从而将文本信息转化为易于建模的数字信息。在文本主题方向,LDA较LSA(Latent Semantic Analysis)、PLSA(Probabilistic Latent Semantic Analysis)等方法更为有效。毕凌燕等选取微博中房地产、教育、旅游三大热点,分别利用LDA和基于TFIDF的K-means聚类方法识别热点话题,结果证明:LDA可以较好地模拟微博作者的思考过程,有效识别热点主题,比K-means聚类更适合用来进行微博热点主题识别[4]。
在LDA模型基础上,学者们提出了诸多改进模型来进行社交媒体中的主题研究。张晨逸等人认为微博是一种本身带有一些结构化社会网络信息的特殊文本,LDA主题研究方法不能有效建模,提出基于LDA的MB-LDA微博生成模型,综合考虑了微博的联系人关联系和文本关联关系,辅助进行微博主题挖掘。采用吉布斯抽样法,不仅可挖掘出微博的主题,还可发现联系人关注的主题,该模型可以有效地应用于微博及其他外的社交网络媒体主题挖掘[5]。李楚贞提出了一种新的基于狄利克雷分布的LDA和基于增量聚类算法SinglePass的中文微博主题层次识别方法LSP,LSP方法在首层主题识别时,釆用LDA主题识别方法进行识别,接着在识别子层主题时,引入微博的评论转发功能,改进传统的SinglePass主题识别方法对子层主题进行识别,通过设置大小不同的相似度阈值可生成不同粒度层次的主题集合,从而形成多层的主题结构[6]。锻炼等人认为用户发送的微博主题和周边地理环境及其在时间上的行为规律紧密相关,提出一种顾及连续时间与区域影响因素的时空主题模型,相较传统文本模型提取结果更加准确[7]。 社会舆情主题研究现状概况:http://www.youerw.com/yanjiu/lunwen_27531.html
------分隔线----------------------------
推荐内容