Magnostics Image-based Search of Interesting Matrix Views for Guided Network Exploration(一种基于网络信息矩阵图像的网络探索方法)

网络、关系等数据变成如图的邻接矩阵时(红色代表两个节点也就是人,之间有联系),但是得到的矩阵会因为顺序的问题而出现不同的排列方式,在第一种中会发现因为有聚集的块状区域而很容易地把数据分为两个部分,然后根据数据的具体含义而得知其代表的意思,在此图中可以看出是两个集团。

当分析数据时候,把它转换成矩阵的形式,并运用一些矩阵重排序算法将矩阵变形,变成特定的图案pattern。而现在希望基于图像来查询哪些变形好的矩阵属于同一种pattern。

当前的数据量特别大,数据维度特别多,样式复杂多变,对于探测特定的图像pattern,很难用肉眼去识别一个图案是不是属于一种pattern。当前基于矩阵的图像识别的图像feature特别多,没有一个明确的标准去评定哪种图像特征适合去识别哪种图像的pattern

二.贡献

6种用于检测特定pattern的feature

4种用来衡量feature检测结果的评分标准

补充了可视化分析中基于特征的分析的工具

三. 实验

  • 选取feature

作者选取了常用的27种用于描述图像的feature,并新定义了3种feature(下图中红色为新定义的feature)。

  • 构造数据

作者选取了要探测的6种pattern,并加入4种变化方式,进行组合

6种pattern:

4种变化:

A)Variations

同一种pattern的不同表现形式

B) Point Swap

随机交换其中的点,分为0, 1, 2, 4, 8, 16, 32的百分比的情况,32%的情况分辨不出其所属的pattern(此时为Noise)

C)Index Swap

随机交换两行或两列,在这里为0-10次随机交换

D)Masking

添加额外的点,(0% to 16%)

  • 生成向量

对于每一个矩阵和一个feature,都可以看成是一个向量,并计算之间的欧几里得距离,同一个feature的向量之间距离越近可以认为两个pattern十分相近。

  • 标准分析

根据向量的距离进行分析,通过作者定义的4种衡量标准。

a)?0?2?0?2?0?2?0?2?0?2?0?2?0?2C1评分标准1

用来评估,一个feature能否把pattern从噪音(Masking)中区分出来,下图中颜色越深代表其评分越高,满分为1。为0或打叉的表示其在此种变化时并没有实际的意义,不需要进行测试。

b)?0?2?0?2?0?2?0?2?0?2?0?2C2评分标准2

用来评估,一个feature对于同一种pattern的不同表现形式的区分程度,如果向量间距离越大,说明可以有效的区分。

图片表示对于同一张pattern的不同表现形式(种类) 的矩阵与feature组成向量的距离差,颜色越深表示距离越近。

下图中颜色越深表示其C2的评分越高,满分为0.5

c)?0?2?0?2?0?2?0?2?0?2?0?2?0?2C3评分标准3

用来评估,一个feature对于同一种pattern添加噪音(Point Swap, Index Swap)之后的区分程度,也是对于噪音的敏感程度,越不敏感说明效果越好。

上图横坐标表示噪音的添加率,纵坐标表示和原pattern向量的距离。黑色的点代表pattern不同表现形式的向量和原pattern向量的距离,红色点表示平均距离,此图表示对于噪音的添加,距离的增长并不快。所以敏感程度很低,C3评分越好

上图可以看出距离的增长很快。所以敏感程度很高,C3评分越不好

此图可以看出距离的增长不是很快。

但是和第一个图比较,虽然敏感性不如它好,但是对于pattern的表现变化区分的很快,也就是图中的黑点。所以C3评分不如第一个图,但是C2评分高于它

此图可以看出对于噪音的增加,距离是一个逐渐增大的趋势,趋势越慢说明抗噪音程度越好。

上图为C3的评分,颜色越深表示抗噪音干扰的强度越高

d)?0?2?0?2?0?2?0?2?0?2?0?2C4评分标准4

用来评估,一个feature把pattern分别出来的能力,C1表示从噪音模式中区分。把所有的向量两两作差取平均值,来判断对于不同的pattern,他们之间的距离是否距离的比较远,可以进行区分。

下图表示模式之间距离的远近,也就是区分pattern能力的大小,盒须图整体越高的代表其区分能力越大,红色的feature的区分能力很强,C4的评分越高。

五.实验总结
评分标准中,C1,C4为主要评分标准,C2,C3要根据具体的feature的含义特点进行加权处理与取舍。

下图表示feature的C1(蓝色),C2(红色),C3(棕色)的评分,黑色点越多,代表其评分在C1、C2或C3上,所以得feature中的排名越高。图中的框选的feature代表最后作者所选的6种feature

时间: 2024-08-05 22:39:04

Magnostics Image-based Search of Interesting Matrix Views for Guided Network Exploration(一种基于网络信息矩阵图像的网络探索方法)的相关文章

leetcode Search a 2D Matrix II

题目连接 https://leetcode.com/problems/search-a-2d-matrix-ii/ Search a 2D Matrix II Description Write an efficient algorithm that searches for a value in an m x n matrix. This matrix has the following properties: Integers in each row are sorted in ascend

【LeetCode】240. Search a 2D Matrix II

Search a 2D Matrix II Write an efficient algorithm that searches for a value in an m x n matrix. This matrix has the following properties: Integers in each row are sorted in ascending from left to right. Integers in each column are sorted in ascendin

leetcode——Search a 2D Matrix 二维有序数组查找(AC)

Write an efficient algorithm that searches for a value in an m x n matrix. This matrix has the following properties: Integers in each row are sorted from left to right. The first integer of each row is greater than the last integer of the previous ro

[leedcode 240] Search a 2D Matrix II

Write an efficient algorithm that searches for a value in an m x n matrix. This matrix has the following properties: Integers in each row are sorted in ascending from left to right. Integers in each column are sorted in ascending from top to bottom.

leetcode_74题——Search a 2D Matrix(数组查找)

Search a 2D Matrix Total Accepted: 40009 Total Submissions: 127082My Submissions Question Solution Write an efficient algorithm that searches for a value in an m x n matrix. This matrix has the following properties: Integers in each row are sorted fr

LeetCode: Search a 2D Matrix 解题报告

Search a 2D Matrix Write an efficient algorithm that searches for a value in an m x n matrix. This matrix has the following properties: Integers in each row are sorted from left to right. The first integer of each row is greater than the last integer

Search a 2D Matrix II

Write an efficient algorithm that searches for a value in an m x n matrix, return the occurrence of it. This matrix has the following properties: Integers in each row are sorted from left to right. Integers in each column are sorted from up to bottom

lintcode 中等题:search a 2d matrix II 搜索二维矩阵II

题目 搜索二维矩阵 II 写出一个高效的算法来搜索m×n矩阵中的值,返回这个值出现的次数. 这个矩阵具有以下特性: 每行中的整数从左到右是排序的. 每一列的整数从上到下是排序的. 在每一行或每一列中没有重复的整数. 样例 考虑下列矩阵: [     [1, 3, 5, 7],     [2, 4, 7, 8],     [3, 5, 9, 10] ] 给出target = 3,返回 2 挑战 要求O(m+n) 时间复杂度和O(1) 额外空间 解题 直接遍历,时间复杂度是O(MN) public

[LintCode] Search a 2D Matrix

Search a 2D Matrix Write an efficient algorithm that searches for a value in an m x n matrix. This matrix has the following properties: Integers in each row are sorted from left to right. The first integer of each row is greater than the last integer