基于PageRank算法的网络数据分析(2)
时间:2023-05-02 21:21 来源:毕业论文 作者:毕业论文 点击:次
6
2 PageRank 算法的发展历程 6 2。1 PageRank 的提出 6 2。2 PageRank 的发展及现状 6 3 PageRank 算法的介绍 7 3。1 PageRank 算法简介 7 3。2 PageRank 值计算 8 4 网络数据分析的实例运用 8 5 对 PageRank 算法的实例总结 11 6 展望 12 参考文献 12 致谢 13 1 绪论 1。1 研究背景和意义 近十年来中国经济的迅速发展的同时,互联网的发展更是日新月异,上网用户急剧增加,互联网已 经融入到社会生产生活的各个方面。据中国互联网络中心发布的第 39 次《中国互联网络发展状况统计论文网 报告》统计显示,截至 2016 年 12 月,中国网民规模达 7。31 亿,相当于欧洲人口总量,互联网普及率 达 53。2%。中国在近 20 多年的发展历程中,中国最令世界瞩目的除了经济的翻天覆地的变化外,互联 网的发展也不可小觑,仅仅 20 多年的互联网发展,中国的互联网领域从起步到今天这样朝气蓬勃,几 乎在中国各个地方的大街小巷都已经受到互联网的影响,互联网已经与人们的生产生活紧密的联系在一 起,尤其是在网络信息方面,因此网络搜索是网上获取信息的最基本技能,对网络信息重要性的研究也 势在必行。 人们在日常生活中网上搜索的过程中,时常从一个起始网页开始搜索查询信息,之后往往会被那些 带有链接文字所描述的相关网页所吸引或者迷惑,从而点击到并打开另一个与搜索目的不相关的网页, 甚至可能依次重复进行这样的窘迫,直到对上网搜索的目标信息感到疑惑,而造成这种难以快速查到信 息或者查不到信息的问题,正是由于网页和网页通过链接关系构成的这个整体网络关系的链接,使得上 网查询这个过程难以准确快速的实现。在 1997 年这个问题引起两个美国大学生拉里佩奇和谢尔盖布林 的关注,经过他们的学习研究,并提出了 PageRank 算法模型用于解决此类网页链接关系的问题,由于 他们这个算法的提出,网页与网页之间的链接关系的深层次价值也引起了人们的重视。他们并以此为基 础创立了 Google 搜索引擎,Google 也因 PageRank 算法大放异彩,取得了引人注目的商业成功。这时 这个算法本身价值无论在学术界还是商业届都引起了极大的重视。直到今日,许多研究网络连接关系的 算法也是以此为基础衍生出来的。PageRank 算法主要是用来标识那些重要性或者价值更高的网页,搜 索引擎再通过算法计算出来的重要性进行排序,那些 PageRank 值越高的网页就说明在某种意义上这个 网页就越重要或更有价值,搜索引擎就会让它们在各种网页排序时凸显出来,从而更加便于人们搜索查 询。因此 PageRank 也叫网页排名或佩奇排名。 本文以基于 PageRank 算法的网络数据分析为为核心,主要以一个网络关系图进行 PageRank 值计算, 并对各个页面重要性分布情况进行相应分析,并与度分布进行比较,从中找到更加完善的 PagRank 算法 联系,使之运用在现实中的网络页面的分布排序中,提高网页搜索的相关性和准确性。 (责任编辑:qin) |