可以把互联网上的各网页之间的链接关系看成一个链接图。假设上网者浏览的下一个网页链接来自于当前网页。建立简化模型:对于任意网页Pi,它的Page Rank值可表示如下:
构造一个链接矩阵M, 如果存在i到j的链接,则令Mij=1/Lj, 否则令Mij=0。容易得到Page Rank值的向量PR满足“MPR=PR”。计算Page Rank值的过程其实就是求矩阵特征向量的过程。为了得到满足这个条件的PR可以用迭代的方法,迭代公式即为来,自|优;尔`论^文/网www.youerw.com
PRi+1=MPRi
初始向量令每个分量为1/N,N为总网页数。
这个迭代方法有效,就是V收敛的条件是:(1)M必须是非循环的;(2)M必须为强连通。条件(1)由网络结构决定,条件(2)可以通过增加一个衰减因子C来解决,一般取0.85。新公式定义如下,
PRi+1=CMPRi+CE/N
其中,E为单位矩阵。
通过分析这种方法的优缺点,再引入利用网页相似度的解决办法。