C: 派系过滤算法举例
图2.5 派系过滤算法举例
③GN算法被很多学者和科学家所研究;基于潜在语义算法是最近才被人们所发现的算法;派系过滤法和基于潜在语义算法一样,被人类研究得比较少。
2.3分析三种算法的弊端及改进
2.3.1GN算法的弊端及改进
GN算法存在一个缺陷,就是它对于网络的社团结构并没有一个量的定义,在不知道社团数目的情况下,GN算法不知道分解要进行到哪一步终止。为了解决该问题,Newman等人引进了一个衡量网络划分质量的标准——模块度。
考虑某种划分方式,此时将网络划分为k个社团,定义:
①对称矩阵E=(eij), eij表示网络中连接两个不同社团的节点的边的在所有边(原始网络)中所占的比例,这两个节点分别位于第i个社团和第j个社团。
②矩阵中的对角线上各元素之和它表示网络中某一社团内部的边在所有边中所占比例。
③每行元素之和,它表示与第i个社团中的节点相连的边在所有边中所占比例。在此基础上定义模块度的衡量标准:
注:‖x‖表示矩阵x中所有元素之和。
上式的物理意义是:网络中连接两个同种类型的节点的边(社团内部边)的比例,减去在同样的社团结构下任意连接两个节点的边的比例的期望值。
当时,记Q=0。Q上限为1,当网络越接近1的时候,说明网络的模块化结构越明显,反之接近0则不具备模块化结构。实际网络的模块化值往往在0.3到0.7之间。
在GN算法中选取Q较大的社团划分方式。
上一页 [1] [2] [3] [4] [5] [6] [7] [8] [9] [10] 下一页