网络舆情传播中社会网络关系识别(2)
时间:2018-06-03 15:45 来源:毕业论文 作者:毕业论文 点击:次
4 社会网络关系识别的应用:社会网络的意见领袖识别 33 4.1 意见领袖识别方法选取 33 4.2 基于PageRank算法的意见领袖识别 33 4.3 实验结果与分析 36 5 结论 40 5.1 本文工作总结 40 5.2 本研究的不足及展望 40 致谢 41 参考文献 42 图1-1 论文的组织结构 7 图2-1 微博主页示例 9 图2-2 高级搜索设置页面 10 图2-3 微博高级搜索结果页面 11 图2-4 微博用户“名片”弹出层 13 图2-5 微博用户基本信息获取Ajax接口演示 13 图2-6 微博用户id查看 13 图2-7 微博评论抓取Ajax接口演示 14 图2-8 页码数超链接节点action-data属性 14 图2-9 PR值沉淀现象 18 图3-1 微博高级搜索结果页面最后一页 21 图3-2 抓取任务执行流程图 23 图3-3 搜索任务执行流程图 24 图3-4 微博系统总体简化ER图 24 表3-1 微博用户表(weibo_blogger) 25 表3-2 微博表(weibo_info) 25 表3-3 转发表(weibo_forward) 25 表3-4 评论表(weibo_comment) 26 表3-5 转发关系表(weibo_forward_rel) 26 表3-6 评论关系表(weibo_comment_rel) 26 表3-7 @提醒关系表(weibo_at_rel) 26 表3-8 抓取任务表(weibo_task) 27 表3-9 搜索任务表(weibo_pages_log) 27 表3-10 转发与评论抓取任务表(weibo_hot_weibo) 27 图3-5 新浪微博抓取系统总体框架设计图 28 图3-6 CloseableHttpClient发送HTTP请求及接收响应并处理网络异常 30 图3-7 使用Selenium WebDriver驱动浏览器代码示例 30 图3-8 使用Fastjson解析JSON数据示例 31 图3-9 存储模块代码示例 32 图4-1 用Python实现的WeiboRank算法关键代码 36 图4-2 系统界面 37 表4-1 WeiboRank算法识别出的前50位意见领袖 37 表4-2 单条微博转发数从高到低排名前50的微博用户 38 图4-3 微博用户WR值排名与单条微博转发数排名对比 39 1 引言 随着计算机网络技术的迅猛发展,互联网逐步渗入到人们生活的各个方面,网络成为继报纸、广播、电视之后的又一新兴信息传播载体。通过互联网,信息的传播速度空前加快,传播范围急剧扩大,信息传播的方式也更加多样化。在Web2.0时代,普通的互联网用户不仅是信息的接收者,也是信息的发布者和传播者。人们可以方便地获取信息和发布信息,人与人之间的交流也更加方便快捷。同时社会中发生的重大事件通过网络迅速扩散,受众更广,其传播影响力远远超过传统渠道。因此网络舆情引起人们的广泛关注。网络舆论是自由的,但其内容的质量参差不齐,带有偏激情感的信息很容易引起网民情绪激愤,引发突发事件,造成巨大的社会财产损失。为了避免此类事件的发生,减少社会经济损失,使用社会网络分析法研究网络舆情的社会网络结构,发掘其传播规律及核心节点,以便做出针对性的舆论引导和舆论监控,使事件的态势在可控范围内发展。 (责任编辑:qin) |