05-spectral 图机器学习之谱分解

目标:

1)创建图的表征矩阵

2)分解:计算矩阵的特征值和特征向量;基于一个或多个特征值,将每个点表示成低维的表征

3)分组:基于新的表征,进行聚类



例如,二分图中如何确定好的分类?类间差异大,类内差异小

最小割集

考虑:

1)团外的连接性

2)团内的连接性

评价方式:

团间的连接性与每个团的密度相关

spectral graph partitioning  谱图分割

无向图G的邻接矩阵A

x是n维的特征向量,可认为是G中每个节点的label或者value

那么Ax等到的结果的意义是?

yi是节点i的邻居节点的label的和

通过yi生成新的x value

谱图理论:

分析G的表征矩阵的spectrum

spectrum的意义:图的特征向量xi,(由特征值大小排序而得)

一个例子:假设G中的所有节点的度都有d,G是连通的。那么,G的特征值和特征向量是?

d是A的最大特征值

若G不是完全连通的

矩阵表征

邻接矩阵:对称矩阵,有n个特征值,特征向量是实数且是正交的

度矩阵:

拉普拉斯矩阵:L=D-A

对称矩阵

λ=λ1=0  ??

特征值为非负实数

特征向量是实数且永远正交

对于对称矩阵M,λ2的值由一公式可定  为xi--xj的平方和

找到最优的x

发现最优的割法

谱聚类算法:

1)图的表征矩阵

2)矩阵的特征值和特征向量;基于特征向量生成每个店的低维向量

3)分组

例子

k-way spectral clustering  k聚类

1)迭代的二分类

2)对eigenvector多聚类

如何选择最优k——从特征值中,挑选间隔最大的两个相邻值


基于motif的谱聚类

基于连接模式进行聚类~

主题1:发现motif的模块

定义motif conductance

生成motif是的cut和volumn

找到节点集S使motif conductance最小, 但找到s较难

解决方案:通过谱的方法

步骤:

1)生成权重矩阵,值为该边参与生成motif的次数

2)谱聚类的方法

3)分组

两个例子:食物链中未知的motif; 通信网络中已知的motif

未知的——每个motif跑一遍,找最小的

基因管理网络

来自为知笔记(Wiz)

原文地址:https://www.cnblogs.com/combfish/p/12271470.html

时间: 2024-10-28 16:01:56

05-spectral 图机器学习之谱分解的相关文章

07-noderepr 图机器学习之图表征学习

网络中的机器学习 节点分类 链接预测 机器学习的生命圈需要特征工程 网络的特征学习--特征向量   embedding network embedding的意义 节点的表征 节点的相似度衡量→网络相似度衡量 网络信息编码,生成节点表征 用途:异常检测,属性预测,聚类,关系预测 例子:deepwalk 难度:当前的深度学习视为序列或网格数据而设计的,但网络结构比这些更复杂,没有固定的空间结构,没有固定的顺序,是动态的,并且有多类特征 Embedding Nodes 假设我们有图G,V是节点集合,A

10-graph-gen 图机器学习之图生成模型

图深度生成模型 deep generative models for graph 回顾上一节课中的图编码,图卷积等 今天,来学习图深度解码,也就是反编码,最终输出一个图结构 Problem of Graph Generation图生成需要解决的问题 给定一个真实图,生成一个合成图 那么,什么才是好的生成模型? 图生成的意义 生成→深入探索图行程的过程 异常检测 预测--从过去预测未来 新网络的仿真 图填充 如果...场景?? 图生成的任务: 真实图的生成 目标导向图的生成,例如分子生成 为什么如

ZUFE OJ 2145 05机关图

Description Ink最近得到了一张藏宝图,这张图上共有n个藏宝室,但因为年代久远藏宝图上的路已经模糊不清,于是Ink找到了智慧的Pseudo,Pseudo告诉Ink,这个宝藏中每两个藏宝室之前都有一条通路,每条通路上都有一定数量的机关.现在Ink已经探明了其中n-1条路上的机关数目,这n-1条路不构成任何环路.众所周知Ink是个乐天派,他坚持认为自己探明的这些路构成的无环联通子图中机关总数是唯一且最少的,现在假设他的想法是对的,他想知道整个图中最少共有多少机关? Input 第一行是一

11-pagerank 图机器学习之PageRank

pagerank:链接分析 如同图谱的网络 每个网页相互链接,是一个有向图,强连通分量 设计一个计算十堰,找到给定节点的输入与输出成分(?) 节点:网页 边:超链接 次要问题:动态页面如何解决?暗网--无法直接进入的网页 网页的现状:不一定通过导航链接,而通过交易事务(?),例如邮件,评论,评论,点赞,购买等 是一个有向图 其他类型的信息网络:如引用网络,百科中的引用 In(v) OUT(v)的定义:通过输入或输出关系可以接触节点v的节点集合 有向图的推理 有向图的两种类型: 1)强连接(任意两

01-introduction 图机器学习介绍

Networks: Networks are a general language for describing complex systems of interacting entities. 网络(关系图)是描述交互实体复杂系统的通用语言 Networks/Graph 的两种类型:1) Networks(Natural Graphs 自然网络):如 社会,基因或蛋白质的交互 2) Information Graph(信息图):信息/知识是经过组织和链接的:(scene graphs)实体在特

08-GNN 图机器学习之图神经网络

图神经网络 node embedding 回顾了之前node2vec的例子以及深度学习卷积的一些基础 浅层encoder的局限性: 参数数量O(v):节点间没有共享参数,每个节点有自己的embedding 不能表征未见过的节点 没有综合考虑节点特征 本节学习图神经网络,多层的非线性的 那么,在图中,如何做卷积? 如果输入是邻接矩阵,那么模型不能适配各种规模的网络:对节点的顺序也没有敏感性 图的深度学习基础 起初,对于一个图G V:节点集合 A:邻接矩阵 X:节点的特征向量 图卷机网络 思路:图的

15-outbreak 图机器学习之爆发检测

网络的爆发检测 outbreak detection 近似算法,加速贪婪爬升,证明数据依赖 给一个真实的城市水源分布网络 以及污染物如何再网络中传播的数据 尽可能快的检测到污染物 检测信息的爆发 一般的问题: 1) 两个示例都是同样的潜在的问题 2) 给定一个网络传播的动态过程,我们希望选择一个节点集合来高效的检测过程 更多的应用: 流行病:影响力传播:网络安全 水网络: 放置传感器的用途:水流动力学,家庭需求 下图中的颜色表示不同的应用需求,红,黄,绿 表示不同的影响爆发 给定一个图,outb

02-gnp-smallworld 图机器学习之最小世界

本节重点:如何衡量一个网络 (网络量化) 网络的关键属性: 1. 度的分布:P(k) 2. 路径长度:h 3. 集聚系数(clustering coefficient):C 4. 连通分量(connected components):s 1. 度的分布 degree distribution:P(k) 统计每个节点的度,形成归一化后的直方图 2. 路径 3. 距离:最短路径 4. 直径:网络中任意节点最短距离的最大值 5. 平均路径长度(针对连通图或强连通的有向图) 6. 集聚系数(无向图):

01-Structure of Network 图机器学习之网络结构基础

网络结构: 对象: 节点,端点 (nodes, vertices) N 交互:链接,边 (links,edges) E 系统:网络,图,图谱 (network,graph) G(N,E) Graph与Network的区别: Network:真实存在的系统,如网络Web,社交网络social network,新陈代谢网络Metabolic network(常用词:network, node, link) Graph: 网络的数学表示,如网络图谱Web graph,社交图谱 Social graph