新浪微博自发布出来,对我们生活中的一些行为产生了极大的影响和改变;随着微博的持续高速发展,微博在各方面得到了极大的关注,吸引着各界学者的研究和分析,统计学、心理学、金融学等一些领域对微博开展了深度的研究和挖掘。在整理和学习国内外有关微博方面的科学文献时,主要有以下几个方面的收获:微博网络结构领域特征研究、微博用户研究、微博热点挖掘、微博应用研究等。本文主要是分析研究有关于微博的用户关系,所以对于微博用户关系的研究成果主要可以分为以下两个方面:
(1) 有关于用户关系的分析,解利群、颜清华等人总结出直观模型——微博“围观模型”,运用了社会网络的分析理论,从社会网络学方法分析视角微博中人与人之间的关系量化情况。这一个模型显示了微博用户关系整体网络的基本特征:明星用户与明星用户之间的交流和互动的情况很常见,他们可以逐渐形成一个交流的朋友圈;而占大多数的普通微博用户则处于“围观”状态,位于网络交流的外围,与明星用户之间基本无法进行直接的交流,因此在某种程度上大多数的普通微博用户只是对明星用户的微博信息进行单方面的传播与阅读;“围观模型”这一模型体现了微博交互网络的一个特征,并且也折射出了目前的现实社会中交互交流困难的一个网络关系特点。袁园、孙霄凌、朱庆华的研究对象是通过随机选取的部分微博用户,然后抓取其关注的人的数据,建立社会网络结构图,以关联的关系,然后对此样本数据的整个外部网络、网络内子结构以及角色位置利用社会网络方法分析,并且与此同时使用聚类分析法来对此样本数据进行研究分析,所以他们用抓取得来的微博用户关注的数据,挖掘出微博用户关注对象的分布,分析出用户对象之间的关联性,对于目前的微博关系的分析研究提出有用的建议。26794
(2) 有关于用户特征的分析,杨小朋、何跃通过Spearman和Pearson研究得出的相关系数,分别来对一个博文的听众的数量以及收藏该博文的人数、博文魅力指数等变量进行分析,通过K-Means聚类算法对选定的微博用户的听众人数和微博的魅力指数进行聚类分析,提出“博文魅力指数”概念,结果表明:当博文魅力指数增长时,收藏博文人数也相应增长,由此可知这两个变量正相关;实验分析得出的聚类报告将微博的用户分为三种类型:信息获取型、草根名人型、普通社交型。何黎、孙何跃等人通过挖掘包括核心用户在内的行为特征,以及针对微博用户的相关信息以及关系结构数据进行了三种类型的分析:它们分别是相关性、关联性原则和决策树规则,结果表明:微博中的名人明星用户的粉丝数量大,但是收听关注的人数数量少的特征;微博用户为了提升自己的被关注度,通常采取两种措施:积极关注其他微博用户以及积极发布博文。而且研究得出两种不同性格的用户的微博习惯:如果微博用户愿意公布性别或者自身相关信息,那么他们通常会发布博文,而如果微博用户不愿意公布自己的性别或者自身相关信息,那么他们一般来说就不愿意发布博文。论文网
基于以上的研究成果,本文的数据源从新浪微博当中抓取,通过新浪开放平台API接口以及java运行环境,使用d3.js绘图,用javaweb最基本的servlet+jsp tomcat7.0 ,用Jsoup 模拟登陆,插入登录的cookie,并模拟提交以获得return的authorize code,从而输出微博关系图,读取微博用户的相关数据,并对微博用户关系分析和研究。 微博用户关系国内外研究现状:http://www.youerw.com/yanjiu/lunwen_21077.html