4 社会网络关系识别的应用:社会网络的意见领袖识别 33
4.1 意见领袖识别方法选取 33
4.2 基于PageRank算法的意见领袖识别 33
4.3 实验结果与分析 36
5 结论 40
5.1 本文工作总结 40
5.2 本研究的不足及展望 40
致谢 41
参考文献 42
图1-1 论文的组织结构 7
图2-1 微博主页示例 9
图2-2 高级搜索设置页面 10
图2-3 微博高级搜索结果页面 11
图2-4 微博用户“名片”弹出层 13
图2-5 微博用户基本信息获取Ajax接口演示 13
图2-6 微博用户id查看 13
图2-7 微博评论抓取Ajax接口演示 14
图2-8 页码数超链接节点action-data属性 14
图2-9 PR值沉淀现象 18
图3-1 微博高级搜索结果页面最后一页 21
图3-2 抓取任务执行流程图 23
图3-3 搜索任务执行流程图 24
图3-4 微博系统总体简化ER图 24
表3-1 微博用户表(weibo_blogger) 25
表3-2 微博表(weibo_info) 25
表3-3 转发表(weibo_forward) 25
表3-4 评论表(weibo_comment) 26
表3-5 转发关系表(weibo_forward_rel) 26
表3-6 评论关系表(weibo_comment_rel) 26
表3-7 @提醒关系表(weibo_at_rel) 26
表3-8 抓取任务表(weibo_task) 27
表3-9 搜索任务表(weibo_pages_log) 27
表3-10 转发与评论抓取任务表(weibo_hot_weibo) 27
图3-5 新浪微博抓取系统总体框架设计图 28
图3-6 CloseableHttpClient发送HTTP请求及接收响应并处理网络异常 30
图3-7 使用Selenium WebDriver驱动浏览器代码示例 30
图3-8 使用Fastjson解析JSON数据示例 31
图3-9 存储模块代码示例 32
图4-1 用Python实现的WeiboRank算法关键代码 36
图4-2 系统界面 37
表4-1 WeiboRank算法识别出的前50位意见领袖 37
表4-2 单条微博转发数从高到低排名前50的微博用户 38
图4-3 微博用户WR值排名与单条微博转发数排名对比 39
1 引言
随着计算机网络技术的迅猛发展,互联网逐步渗入到人们生活的各个方面,网络成为继报纸、广播、电视之后的又一新兴信息传播载体。通过互联网,信息的传播速度空前加快,传播范围急剧扩大,信息传播的方式也更加多样化。在Web2.0时代,普通的互联网用户不仅是信息的接收者,也是信息的发布者和传播者。人们可以方便地获取信息和发布信息,人与人之间的交流也更加方便快捷。同时社会中发生的重大事件通过网络迅速扩散,受众更广,其传播影响力远远超过传统渠道。因此网络舆情引起人们的广泛关注。网络舆论是自由的,但其内容的质量参差不齐,带有偏激情感的信息很容易引起网民情绪激愤,引发突发事件,造成巨大的社会财产损失。为了避免此类事件的发生,减少社会经济损失,使用社会网络分析法研究网络舆情的社会网络结构,发掘其传播规律及核心节点,以便做出针对性的舆论引导和舆论监控,使事件的态势在可控范围内发展。 网络舆情传播中社会网络关系识别(2):http://www.youerw.com/jisuanji/lunwen_16910.html