Jsoup微博关系图的研究与实现(2)
时间:2018-08-09 16:51 来源:毕业论文 作者:毕业论文 点击:次
微博用户发送消息具有很大的实时交互性,所以它可以成为当今国内外的主流社交媒体。用户在使用微博的过程中,往往在其中结成某种关系,比如亲情、好友或拥有共同爱好的朋友关系,在使用微博的过程中因为某些评论或共同购买而产生的共同兴趣关系,用户之间的关注关系等。分析和挖掘微博中复杂的用户关系不仅可以精确、高效率的给拥有共同兴趣爱好的微博用户群体提供兴趣好友推荐,还可以引导、激发和助推社会事件中的舆论发展趋势,甚至可以大大降低消费者和企业的交易成本,推动企业不断创新营销模式。 1.1 研究背景 伴随着我国计算机技术以及互联网技术水平的快速发展,2014年我国的信息化进程已经与发达国家一同步入网络化的时代,截至2015年5月,中国网民数量已经突破6.5亿,初步实现了网络化。可以预见,互联网技术已经逐渐融入到了我们的正常生活之中,网络技术正在影响着我们的生活、工作,学习、交流方式等,成为我们日常生活中极为重要的组成部分。这些年来,国内外的社交平台争相出现,国外的有Facebook、Twitter,国内的有QQ、人人网、微信等,我们在这些社交平台上与好友、亲人、同学等交流和沟通。透过这些平台,我们能够与亲戚朋友时常进行交流沟通,而且还可以结交到一些兴趣相同的新朋友,它们能够让我们的交流通信变得更便利,减少因为地理距离过远而带来的麻烦。“微博”作为消息传播的新模式,作为我国国内社交平台(QQ、人人、微信)的中坚力量,据新浪微博最新的数据显示,至2014年12月,中国互联网信息中心发布的第35次中国互联网发展统计报告显示,我国微博用户数量规模为2.49亿,用户活跃度保持稳定。用户规模如此之大,微博数据如此庞大,因此对微博数据的挖掘和用户关系的研究就很有必要了。 1.2 研究意义 微博,是一个基于用户关系的平台,在微博上面,我们可以分享、传播以及获取信息。通过网页、手机等客户端来组建个人社交环境,用户可以在140字的限制内更新信息,实现信息的随时随地的分享。微博作为一个新的交互平台,改变了传统常规的传播方式,是一种全新的社交交互方式。对微博用户关系的挖掘和研究有很大的积极意义,我们可以通过对用户的个人信息、粉丝关系、间接关系、活动习惯等进行分析,对用户间关系绘图,让用户可以简洁明了的看到自己关系用户,行为活动习惯等;图形化显示微博用户的潜在关系,能够进一步深刻的了解到用户圈子是怎样形成的,它们有哪些相似点、感染力等,这也有助于后面分析研究的展开。 1.3 研究现状 新浪微博自发布出来,对我们生活中的一些行为产生了极大的影响和改变;随着微博的持续高速发展,微博在各方面得到了极大的关注,吸引着各界学者的研究和分析,统计学、心理学、金融学等一些领域对微博开展了深度的研究和挖掘。在整理和学习国内外有关微博方面的科学文献时,主要有以下几个方面的收获:微博网络结构领域特征研究、微博用户研究、微博热点挖掘、微博应用研究等。本文主要是分析研究有关于微博的用户关系,所以对于微博用户关系的研究成果主要可以分为以下两个方面: (1) 有关于用户关系的分析,解利群、颜清华等人总结出直观模型——微博“围观模型”,运用了社会网络的分析理论,从社会网络学方法分析视角微博中人与人之间的关系量化情况。这一个模型显示了微博用户关系整体网络的基本特征:明星用户与明星用户之间的交流和互动的情况很常见,他们可以逐渐形成一个交流的朋友圈;而占大多数的普通微博用户则处于“围观”状态,位于网络交流的外围,与明星用户之间基本无法进行直接的交流,因此在某种程度上大多数的普通微博用户只是对明星用户的微博信息进行单方面的传播与阅读;“围观模型”这一模型体现了微博交互网络的一个特征,并且也折射出了目前的现实社会中交互交流困难的一个网络关系特点。袁园、孙霄凌、朱庆华的研究对象是通过随机选取的部分微博用户,然后抓取其关注的人的数据,建立社会网络结构图,以关联的关系,然后对此样本数据的整个外部网络、网络内子结构以及角色位置利用社会网络方法分析,并且与此同时使用聚类分析法来对此样本数据进行研究分析,所以他们用抓取得来的微博用户关注的数据,挖掘出微博用户关注对象的分布,分析出用户对象之间的关联性,对于目前的微博关系的分析研究提出有用的建议。 (责任编辑:qin) |