第五章节点的重要性与相似性
关键节点是网络科学的重要研究内容之一
本章要重点详细介绍无向网络中节点重要性排序的几个常用指标:度值,介数,接近数,k-壳值和特征向量
5.2无向网络节点重要性指标
5.2.1度中心性
一个节点度越大就意味着这个节点越重要。
此类问题都与如何刻画节点在网络中的位置有关,这便是度中心性的问题了
5.2.2介数中心性:
概念:以经过某个节点的最短路径的数目来刻画节点重要性的指标就称为介数中心性,简称介数bc
这个概念刻画了节点i对于网络中节点对之间沿着最短路径传输信息的控制能力
理论某节点的最大介数就是(n-1)(n-2)/2
于是基于上述的归一化介数定义为:实际介数/理论介数
介数越高其重要性也就越大
接近中心性:
网络平均长度的另一种计算公式:
全部的节点i到节点j的距离的总和/总长度=d, 这就是网络平均路径长度 该值也在某种程度上反映了节点i在网络中的相对重要性
我们把di的倒数定义为节点i的接近中心性,简称接近数
介数 对于信息的流动具有最大的控制力;
而接近数最大的节点则对于信息的流动具有最佳的观察视野。
5.2.4 k-壳与k-核
k-壳分解:
我们每一次吧度数从到低的次序的节点及其相连的边去掉直至不再有同样度的边 ,并将这些节点划分到相应的k-壳中,这样就得到了网路了k-壳分解。
实际网络中也会出现类似的情形:度大的节点出现在分解的外层,从而得到度大的节点未必是重要的节点。
k-核:>-k的层称为k-核
k-皮:<k的层称为k-皮
核心:由kmax-壳中的节点构成,对Internet性能具有重要影响的一个区域。
对等连通片:有(kmax-1)-皮的最大连通片中的节点构成,这个存在有助于避免和缓解核心部分的拥堵
孤立片:由(kmax-1)-皮中不属于最大连通片的节点构成,大约包括网络中3层的节点。
5.2.5特征向量中心性
基本想法:一个节点重要性即取决于邻居点的数量,也取决于邻居节点重要性
基于这样的思想有两种算法:hits算法;
5.3.2 hits算法描述
基本思想:每个网页有两种刻画指标:权威性和枢纽性
一个页面被多个高枢纽值指向,那么它便具有了高权威值
如果一个页面指向多个高权威性的页面,那么该页面就具有高的枢纽值
算法核心的思想:
迭代过程:在第k步进行如下3种操作:
1.权威值校验:没一节点的权威值校正为指向它的节点的枢纽值之和:
2.枢纽值校正规则:每一点的枢纽值校正为它所指向的节点的权威值之和
3.归一化:
5.4.1pagerank基本算法
开始的时候将1全部平均分配给所有节点,随机访问一个节点,然后这个节点将自己的值全部分配给连接的边节点,这样迭代下去。。。
5.5节点相似性与链路预测
5.5.1问题描述与评价标准
节点相似性分析的一个典型应用就是链路预测,它是通过已知的各种信息预测给定网络中尚不存在的两个节点之间产生链接的可能性
(1)auc算法:
(待更新)
原文地址:https://www.cnblogs.com/zhongyimeng/p/9865015.html