6

2 PageRank 算法的发展历程 6

2。1 PageRank 的提出 6

2。2 PageRank 的发展及现状 6

3 PageRank 算法的介绍 7

3。1 PageRank 算法简介 7

3。2 PageRank 值计算 8

4 网络数据分析的实例运用 8

5 对 PageRank 算法的实例总结 11

6 展望 12

参考文献 12

致谢 13

1 绪论

1。1 研究背景和意义

近十年来中国经济的迅速发展的同时,互联网的发展更是日新月异,上网用户急剧增加,互联网已 经融入到社会生产生活的各个方面。据中国互联网络中心发布的第 39 次《中国互联网络发展状况统计论文网

报告》统计显示,截至 2016 年 12 月,中国网民规模达 7。31 亿,相当于欧洲人口总量,互联网普及率 达 53。2%。中国在近 20 多年的发展历程中,中国最令世界瞩目的除了经济的翻天覆地的变化外,互联 网的发展也不可小觑,仅仅 20 多年的互联网发展,中国的互联网领域从起步到今天这样朝气蓬勃,几 乎在中国各个地方的大街小巷都已经受到互联网的影响,互联网已经与人们的生产生活紧密的联系在一 起,尤其是在网络信息方面,因此网络搜索是网上获取信息的最基本技能,对网络信息重要性的研究也 势在必行。

人们在日常生活中网上搜索的过程中,时常从一个起始网页开始搜索查询信息,之后往往会被那些 带有链接文字所描述的相关网页所吸引或者迷惑,从而点击到并打开另一个与搜索目的不相关的网页, 甚至可能依次重复进行这样的窘迫,直到对上网搜索的目标信息感到疑惑,而造成这种难以快速查到信 息或者查不到信息的问题,正是由于网页和网页通过链接关系构成的这个整体网络关系的链接,使得上 网查询这个过程难以准确快速的实现。在 1997 年这个问题引起两个美国大学生拉里佩奇和谢尔盖布林 的关注,经过他们的学习研究,并提出了 PageRank 算法模型用于解决此类网页链接关系的问题,由于 他们这个算法的提出,网页与网页之间的链接关系的深层次价值也引起了人们的重视。他们并以此为基 础创立了 Google 搜索引擎,Google 也因 PageRank 算法大放异彩,取得了引人注目的商业成功。这时 这个算法本身价值无论在学术界还是商业届都引起了极大的重视。直到今日,许多研究网络连接关系的 算法也是以此为基础衍生出来的。PageRank 算法主要是用来标识那些重要性或者价值更高的网页,搜 索引擎再通过算法计算出来的重要性进行排序,那些 PageRank 值越高的网页就说明在某种意义上这个 网页就越重要或更有价值,搜索引擎就会让它们在各种网页排序时凸显出来,从而更加便于人们搜索查 询。因此 PageRank 也叫网页排名或佩奇排名。

本文以基于 PageRank 算法的网络数据分析为为核心,主要以一个网络关系图进行 PageRank 值计算, 并对各个页面重要性分布情况进行相应分析,并与度分布进行比较,从中找到更加完善的 PagRank 算法 联系,使之运用在现实中的网络页面的分布排序中,提高网页搜索的相关性和准确性。

上一篇:基于神经网络的验证码识别算法
下一篇:数据挖掘的主题标绘数据获取技术与实现

基于Apriori算法的电影推荐

基于神经网络的验证码识别算法

基于网络的通用试题库系...

python基于决策树算法的球赛预测

基于消费者个性特征的化...

加密与解密算法的研究【1931字】

一種删除准则的NOMA资源联...

网络语言“XX体”研究

张洁小说《无字》中的女性意识

老年2型糖尿病患者运动疗...

LiMn1-xFexPO4正极材料合成及充放电性能研究

安康汉江网讯

麦秸秆还田和沼液灌溉对...

我国风险投资的发展现状问题及对策分析

互联网教育”变革路径研究进展【7972字】

ASP.net+sqlserver企业设备管理系统设计与开发

新課改下小學语文洧效阅...