1。2 度分布的介绍
人们在最初的网络研究中,为了能够比较形象地刻画网络结构的统计特性,因此提出了许多用于刻 画网络链接关系概念和方法,比如度分布、平均路径长度、联合度分布、介数、核数、紧密度、聚类系 数等基本概念。其中节点的度就是指:与节点 vi 所连接的边的数目,从直观上可以明显看出,一个节 点的度数越大,那么这个节点在某种意义上就显得越重要,度分布是指在一个网络关系中在任取一个节 点所得节点度的概率。
网络节点的度分布是,指一个网络连接关系图中的各个节点的度的概率分布情况,一般用分布函数 P(k)来描述,P(k)表示在整个网络中度数为 k 的节点的所占比例,即,在整个网络中随机抽取到节点 的度为 k 的概率为 P(k)。对于规则网络中的度分布,由于各个节点的度是相同的,因此其度分布集中 在一个单一的尖峰上,是一种 Delta 型分布,网络中任何随机化倾向都将使这个尖峰形状逐渐变宽。完 全随机网络的度分布则近似为泊松分布,其形状在远离峰值时呈指数下降。而近年来的大量研究表明,文献综述
许多事迹网络的度分布明显不同于泊松分布,特别是许多网络的度分布可以用幂率形式 P(k)∝ k来
更加形象的描述。
1。3 研究的方法
本文主要基于 PageRank 算法对网页链接关系图进行 PageRank 值计算分析并与度分布进行比较分 析,主要解决的问题是找到在 PageRank 算法下的网页链接关系之间的规律,对 PageRank 算法进行适当 的评估。在关于同一网路数据进行分析时拟采用以下方法进行比较研究:
1、图像法
对网络数据的网页链接关系图进行求度分布函数以及 PageRank 值分布,画出相应的图像;
2、比较分析法
对同一网络数据的网页链接关系图的度分布以及 PageRank 值分布进行比较分析;
3、总结归纳法
把图像关系分析和比较分析得出的结论进行归纳总结,得到 PageRank 算法与其他算法差异与优缺点。