网络舆情传播中社会网络关系识别(2)_毕业论文

毕业论文移动版

毕业论文 > 计算机论文 >

网络舆情传播中社会网络关系识别(2)


4  社会网络关系识别的应用:社会网络的意见领袖识别    33
4.1  意见领袖识别方法选取    33
4.2  基于PageRank算法的意见领袖识别    33
 
4.3  实验结果与分析    36
5  结论    40
5.1  本文工作总结    40
5.2  本研究的不足及展望    40
致谢    41
参考文献    42
图1-1  论文的组织结构    7
图2-1  微博主页示例    9
图2-2  高级搜索设置页面    10
图2-3  微博高级搜索结果页面    11
图2-4  微博用户“名片”弹出层    13
图2-5  微博用户基本信息获取Ajax接口演示    13
图2-6  微博用户id查看    13
图2-7  微博评论抓取Ajax接口演示    14
图2-8  页码数超链接节点action-data属性    14
图2-9  PR值沉淀现象    18
图3-1  微博高级搜索结果页面最后一页    21
图3-2  抓取任务执行流程图    23
图3-3  搜索任务执行流程图    24
图3-4  微博系统总体简化ER图    24
表3-1  微博用户表(weibo_blogger)    25
表3-2  微博表(weibo_info)    25
表3-3  转发表(weibo_forward)    25
表3-4  评论表(weibo_comment)    26
表3-5  转发关系表(weibo_forward_rel)    26
表3-6  评论关系表(weibo_comment_rel)    26
表3-7  @提醒关系表(weibo_at_rel)    26
表3-8  抓取任务表(weibo_task)    27
表3-9  搜索任务表(weibo_pages_log)    27
表3-10  转发与评论抓取任务表(weibo_hot_weibo)    27
图3-5  新浪微博抓取系统总体框架设计图    28
图3-6  CloseableHttpClient发送HTTP请求及接收响应并处理网络异常    30
图3-7  使用Selenium WebDriver驱动浏览器代码示例    30
图3-8  使用Fastjson解析JSON数据示例    31
图3-9  存储模块代码示例    32
图4-1  用Python实现的WeiboRank算法关键代码    36
图4-2  系统界面    37
表4-1  WeiboRank算法识别出的前50位意见领袖    37
表4-2  单条微博转发数从高到低排名前50的微博用户    38
图4-3  微博用户WR值排名与单条微博转发数排名对比    39
 1  引言
随着计算机网络技术的迅猛发展,互联网逐步渗入到人们生活的各个方面,网络成为继报纸、广播、电视之后的又一新兴信息传播载体。通过互联网,信息的传播速度空前加快,传播范围急剧扩大,信息传播的方式也更加多样化。在Web2.0时代,普通的互联网用户不仅是信息的接收者,也是信息的发布者和传播者。人们可以方便地获取信息和发布信息,人与人之间的交流也更加方便快捷。同时社会中发生的重大事件通过网络迅速扩散,受众更广,其传播影响力远远超过传统渠道。因此网络舆情引起人们的广泛关注。网络舆论是自由的,但其内容的质量参差不齐,带有偏激情感的信息很容易引起网民情绪激愤,引发突发事件,造成巨大的社会财产损失。为了避免此类事件的发生,减少社会经济损失,使用社会网络分析法研究网络舆情的社会网络结构,发掘其传播规律及核心节点,以便做出针对性的舆论引导和舆论监控,使事件的态势在可控范围内发展。 (责任编辑:qin)