新浪微博中的话题突变识别与分析研究(9)
时间:2018-07-05 15:58 来源:毕业论文 作者:毕业论文 点击:次
(1)信息的发布。发布信息是微博用户所能使用的最基本的功能。微博文本内容字数限定在140字以下,也允许添加自己想要添加的各种多媒体信息,如图片、视频等; (2)信息的转发。如若对某条微博内容感兴趣,用户可以将该内容放入自己的主页面中,并且能够在此过程中发表自己的观点。转发过后,关注自己的粉丝就会浏览到该条信息,如若感兴趣可以继续转发,依次循环往复下去; (3)关注他人。如若对其他某个用户的动态比较好奇,微博用户可以选择关注,成为他人的粉丝。这种情况下,就能在个人的主页面上即时呈现出所关注对象的最新动态; (4)评论。微博用户能够针对任意的微博内容发表属于自己的观点; (5)搜索。微博用户能够通过关键字搜索,查找到个人比较感兴趣的微博信息和用户; (6)标签。微博用户能够依据自己的喜好、职业、身份赋予自身不一样的标签,这样能够方便兴趣相投的人快速找到自己,建立交流圈。 3 基于微博统计特征项的微博话题突变识别 3.1 话题突变识别方法 3.1.1 研究思路及方法 微博统计特征项指的是微博中可用来统计的具有代表意义的参数指标,常见的有: (1)粉丝数:即微博关注者的数量; (2)微博数:发布微博的数量; (3)转发数及评论数:微博转发以及评论的数目; (4)地域覆盖指数:关注者地域覆盖的标准差。主要用来反映微博的影响力在地域上分布的均匀程度; (5)发博频率(条/天):微博总数/注册天数。 这些指标有时能很好地衡量微博的关注度、影响力和用户的参与积极性等。在进行具体研究时可能会选取其中具有指示意义的参数进行分析对比。本文中的研究对象是突发话题,而在突发话题中,能够发生较为明显变化的指标是微博数、微博转发数以及评论数,因为它们能很好地反映微博话题的关注度,而突发话题有着较高的关注度,并在其发展过程中的一段时间里有着较大的关注度变化。借此我们可以想到通过检测微博关注度变化,具体的就是相关微博数、微博转发数及评论数的变化,来识别出突发话题的生成。由此我们提出了基于微博统计特征项的微博话题突变识别。而具体方法就是定量分析微博数、转发数及评论数这些统计特征项,设计相关算法计算他们的变化量或变化率,由此表示出微博话题关注度的变化度,从而识别出微博突发话题。 (责任编辑:qin) |