04-communities 图机器学习之社区

网络中的社区结构

信息流通:

节点在此扮演了什么角色?

连接扮演了什么角色?

非网络时代,人们是如何获取工作的?

通过人脉,然而,不少关系是泛泛之交,而亲密关系较少。 那为什么泛泛之交反而更有用?

结构上:短距离的关系亲密,长距离的关系弱

信息上:长距离:获取更多信息

三角闭合——高度聚集的系数

边重叠?

N(i):节点i的邻居集 计算Oij时要除去i,j节点

当overlap==0时,该边为局部桥梁

以下是基于通话网络的分析,可以看出,两节点间的路径越长,其邻居重叠性越多

网络社区:包含。一系列紧密连接的节点集合, 大量的内部连接及小勺的外部连接

如何发现社区?如何拆分网络?

给定边和节点数的configuration model:

使用Q值来衡量S是否为G的社区

Louvain 算法:

贪心算法,时间性能 O(nlogn) 支持带权重的网络,提供分层的社区

可应用于更大的网络,时间性能高,较快收敛

具体看课件,尚未详细看(!!!)

Modularity:将图划分为社区


检测重叠社区:BigCLAM

1) 基于节点的社区关系定义一个生成模型——Community Affiliation Graph Model (AGM)

2) 对于给定的G,假设G是由ASM生成的;找到最佳的AGM;然后,发现社区

。。。。。。

来自为知笔记(Wiz)

原文地址:https://www.cnblogs.com/combfish/p/12271467.html

时间: 2024-11-09 00:31:56

04-communities 图机器学习之社区的相关文章

07-noderepr 图机器学习之图表征学习

网络中的机器学习 节点分类 链接预测 机器学习的生命圈需要特征工程 网络的特征学习--特征向量   embedding network embedding的意义 节点的表征 节点的相似度衡量→网络相似度衡量 网络信息编码,生成节点表征 用途:异常检测,属性预测,聚类,关系预测 例子:deepwalk 难度:当前的深度学习视为序列或网格数据而设计的,但网络结构比这些更复杂,没有固定的空间结构,没有固定的顺序,是动态的,并且有多类特征 Embedding Nodes 假设我们有图G,V是节点集合,A

01-introduction 图机器学习介绍

Networks: Networks are a general language for describing complex systems of interacting entities. 网络(关系图)是描述交互实体复杂系统的通用语言 Networks/Graph 的两种类型:1) Networks(Natural Graphs 自然网络):如 社会,基因或蛋白质的交互 2) Information Graph(信息图):信息/知识是经过组织和链接的:(scene graphs)实体在特

10-graph-gen 图机器学习之图生成模型

图深度生成模型 deep generative models for graph 回顾上一节课中的图编码,图卷积等 今天,来学习图深度解码,也就是反编码,最终输出一个图结构 Problem of Graph Generation图生成需要解决的问题 给定一个真实图,生成一个合成图 那么,什么才是好的生成模型? 图生成的意义 生成→深入探索图行程的过程 异常检测 预测--从过去预测未来 新网络的仿真 图填充 如果...场景?? 图生成的任务: 真实图的生成 目标导向图的生成,例如分子生成 为什么如

02-gnp-smallworld 图机器学习之最小世界

本节重点:如何衡量一个网络 (网络量化) 网络的关键属性: 1. 度的分布:P(k) 2. 路径长度:h 3. 集聚系数(clustering coefficient):C 4. 连通分量(connected components):s 1. 度的分布 degree distribution:P(k) 统计每个节点的度,形成归一化后的直方图 2. 路径 3. 距离:最短路径 4. 直径:网络中任意节点最短距离的最大值 5. 平均路径长度(针对连通图或强连通的有向图) 6. 集聚系数(无向图):

[hiho 04]Trie图

题目描述 Trie 图就是在 Trie 树上建立 fail 指针,类似于KMP算法中的next数组的作用. 这个数据结构的作用是判断一个字符串中是否包含一组字符串中的任意一个. 结构体定义是这样的: typedef struct trie_node { trie_node *nodes[26]; trie_node *fail = NULL; bool word_end = false; trie_node() { for (int i = 0; i < 26; i++) { nodes[i]

11-pagerank 图机器学习之PageRank

pagerank:链接分析 如同图谱的网络 每个网页相互链接,是一个有向图,强连通分量 设计一个计算十堰,找到给定节点的输入与输出成分(?) 节点:网页 边:超链接 次要问题:动态页面如何解决?暗网--无法直接进入的网页 网页的现状:不一定通过导航链接,而通过交易事务(?),例如邮件,评论,评论,点赞,购买等 是一个有向图 其他类型的信息网络:如引用网络,百科中的引用 In(v) OUT(v)的定义:通过输入或输出关系可以接触节点v的节点集合 有向图的推理 有向图的两种类型: 1)强连接(任意两

08-GNN 图机器学习之图神经网络

图神经网络 node embedding 回顾了之前node2vec的例子以及深度学习卷积的一些基础 浅层encoder的局限性: 参数数量O(v):节点间没有共享参数,每个节点有自己的embedding 不能表征未见过的节点 没有综合考虑节点特征 本节学习图神经网络,多层的非线性的 那么,在图中,如何做卷积? 如果输入是邻接矩阵,那么模型不能适配各种规模的网络:对节点的顺序也没有敏感性 图的深度学习基础 起初,对于一个图G V:节点集合 A:邻接矩阵 X:节点的特征向量 图卷机网络 思路:图的

15-outbreak 图机器学习之爆发检测

网络的爆发检测 outbreak detection 近似算法,加速贪婪爬升,证明数据依赖 给一个真实的城市水源分布网络 以及污染物如何再网络中传播的数据 尽可能快的检测到污染物 检测信息的爆发 一般的问题: 1) 两个示例都是同样的潜在的问题 2) 给定一个网络传播的动态过程,我们希望选择一个节点集合来高效的检测过程 更多的应用: 流行病:影响力传播:网络安全 水网络: 放置传感器的用途:水流动力学,家庭需求 下图中的颜色表示不同的应用需求,红,黄,绿 表示不同的影响爆发 给定一个图,outb

05-spectral 图机器学习之谱分解

目标: 1)创建图的表征矩阵 2)分解:计算矩阵的特征值和特征向量:基于一个或多个特征值,将每个点表示成低维的表征 3)分组:基于新的表征,进行聚类 例如,二分图中如何确定好的分类?类间差异大,类内差异小 最小割集 考虑: 1)团外的连接性 2)团内的连接性 评价方式: 团间的连接性与每个团的密度相关 spectral graph partitioning  谱图分割 无向图G的邻接矩阵A x是n维的特征向量,可认为是G中每个节点的label或者value 那么Ax等到的结果的意义是? yi是节