从数学的视角看社交网络

社交网络是有趣而又令人迷惑的,总希望希望从社交网络本身找到一些对移动互联网产品有启发的东西,而自己的社交网络有限,只得求助于专家们的著作了,这点文字是《社交网络分析-方法与实践》一书(地铁阅读时光)的笔记。

社交网络分析(SNA)是探索关系背后的科学与技术,从数学的角度看社交网络,用图论的方法探查社交网络。在技术上,通过python 以及相关包文件的支持,来完成可计算的社交网络(http://www.github.com/maksim2042/SNABook)。

什么是关系呢?在人际关系中,除了友谊,影响,情感,信任之外呢?关系可以是二元的,也可以被赋值,可以是对称的,也可以是非对称的,现实中更常见的是双峰关系或者多模关系。

基于独立性假设,通过泊松过程或朴素贝叶斯可以建立一些模型进行统计分析,进而得到一些宏观结果的概率。但如果抛开独立性假设,认为所有的关系都是潜在的相依关系,着就是图论的用武之地。节点表示网络内的独立行动者,边表示行动者直接的关系,进而通过单模图,双模图,多模图来描述社交网络。数学上表示社交网络的基本方法是矩阵,但是邻接矩阵过于疏松,可以采用边列表的形式来存储社交网络。

用图来描述社交网络,图的距离是对图进行量化分析的一种方法,通过图的遍历可以获得信息传播中的最短路径和距离。我们学过的软件基础来了,深度优先和广度优先的搜索,在NetworkX 中有现成的算法dfs_edges 和bfs_edges.  对于非加权图,距离意味着最短路径;对于加权图,距离是最低成本路径, 而欧几里得距离是建立在节点相似性上的。

谁是社交网络中重要的人?看一个节点的边的个数——程度中心性。程度中心性是服从幂律分布的。

谁是社交网络中的消息传播者?看一个节点的平均距离的倒数——亲近中心性,值越大黏度越大。

谁是传播瓶颈?看每对节点的最短距离,然后归一化处理——居间中心性,值越大越是精英群体。

谁是“灰衣主教”? 相当于对程度中心性递归——特征向量中心性,它是隐形的核心。

google 的pagerank 算法可以说是将中心性理念发挥的淋漓尽致,面向移动产品的PageRank 很有空间呀?

对于社交网络中可分析的单元,图论中以子图和组元来描述。子图是一个以某一特定节点为核心的子网络,就象linkedin中“我的网络”,分析一个网络半径大于3的自我中心网络是一个错误。

关系来了:

1)不对称连接,维系不超过两周

2)对称的连接,较稳定

3)三元组随着时间的推移是最稳定的,然而存在着禁止进入的三元组和结构洞。

有向三元组有16种可能情况,哪些命名诞生于1972年,和我差不多大了。三元组形成了子图,最大的完全子图就是派系。建立子图的方法一般是分层聚类。人们的想法,态度和社会关系是由个体在群体中的身份所决定的,而群体的形成源于成员的态度。

鉴于节点的类型不同,形成了多模网络。从二模网络中可以创建隶属网络,以及同质性网络。对于多模网络,矩阵乘法可以得出很多有价值的结论。

如果可以对移动社交网络进行模拟仿真,是一件多么有意思的事呀? 初始化一个空的网络图,并在其中增加n个数据类型的对象,然后循环遍历每一个可能的节点之间的组合,当概率等于密度的参数的时候,将在两个节点间添加一个连接,这种生成图的算法称为Erdos-Renyi 算法,是一种生成随机图的最简单方法,并产生一个正太分布的度分布,但实际上多数社交网络符合一个长尾的度分布即幂律分布。

时间: 2024-11-05 12:14:37

从数学的视角看社交网络的相关文章

3D 视角看 Go 并发编程

主题:3D 视角看 Go 并发编程 Overview 并发编程综述 Goroutine Channel & Select & waitGroup 消息传递模式 可视化工具 GoTrace 主讲师:PP 先后在百度.第四范式.蚂蚁金服工作,百度 Go Good Coder, 对分布式计算.离线/实时大数据处理有丰富的实战经验.乐于分享自己的技术和学习心得. 一.并发编程综述 串行执行 并发与并行 多核时代的并发编程 左图:p1, p2, p3 这 3 个线程运行在单核上,分时复用 CPU,是

4星|《剑桥中国经济史:古代到19世纪》:经济学视角看中国古代史

剑桥中国经济史:古代到19世纪 万志英教授对自青铜时代至20世纪初这3000年间中国经济发展各种制度的基础.延续以及中断进行了详尽而通俗的研究 作者是海外汉学家.全书从经济学的角度重新梳理了中国古代史,有不少独到的视角与细节.比如说对古代史的分期,与我见过的任何一本书的分期都不同,唐朝以安史之乱为节点被拦腰分成两节归入前后两个时期,前半部分划入从北魏成熟期开始的中国再统一时期,后半部分到北宋灭亡属于第一次经济转型期. 书中涉及到大量历史书上不太提及的经济学问题,比如人民收入水平,粮食价格,实际的

数学基础课--《看数学之美后的随想》(一)什么是数学?

什么是数学? 时隔近一年时间,终于把吴军老师的<数学之美>看完了,其间非常感谢李晓燕同学的帮助,帮我扫了很多盲.这一系列大体会按照<数学之美>的目录来进行构建,然后会附上我的一些理解,其实更多的应该算是摘记吧. 我也尽量会把我会的演算过程附上. 希望大家可以一起交流. 什么是数学? 我们为什么学数学呢? 虽然我们从小都在学数学,但是我们很少知道数学是什么? 那么什么是数学呢? 在如今,人们对数学总有一些议论.记得在中学时代,班里同学,甚至老师,偶尔也会说到,生活中用到的数学,其实在

旧题新做:从idy的视角看数据结构

“今天你不写总结……!!!” 额…… 还是讲我的吧.这些考试都是idy出的题. 20170121:DFS序. ST表.线段树练习 这是第一次考数据结构. Problem 1. setsum 1 second 给你一个长度为N 的整数序列,支持两种操作: • modity l r val 将区间[l,r] 中的所有数修改为val • query l r 询问区间[l,r] 所有数的和 分析:最简单的线段树,区间更改区间求和.但注意是更改,不是添改,sum与flag需同时覆盖. Problem 2.

另类的视角看“UIView”和“CALayer”——灵之于魄,男人之于肾的关系

清晨接连翻阅了几篇关于UIView和CALayer的博文,要么是上来一排排的代码(破坏了优雅的气氛),要么是题不达意(喂,what are you ‘写啥’ 嘞),看的我是雨里雾里,当然也有大牛辛辛苦苦的写的优秀文章,只是最近小编也正在学习“核心动画”,因为核心动画操作的对象不是UIView,而是CALayer,而对于二者那剪不断理还乱的关系 小编索性自己通过这篇博文整理了些粗浅的想法. -=-=-=-=-=-=-=--=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-

透过WinDBG的视角看String

摘要 : 最近在博客园里面看到有人在讨论 C# String的一些特性. 大部分情况下是从CODING的角度来讨论String. 本人觉得非常好奇, 在运行时态, String是如何与这些特性联系上的. 本文将侧重在通过WinDBG来观察String在进程内的布局, 以此来解释C# String的一些特性. 问题 C# String有两个比较有趣的特性. String的恒定性. 字符串横定性是指一个字符串一经创建,就不可改变.那么也就是说当我们改变string值的时候,便会在托管堆上重新分配一块

换一个视角看事务 - 用&quot;Java语言&quot;写&quot;作文&quot;

前段时间在抽工作之空余,更加系统和深入的重新学习Java的一些技术知识. 最近也试着申请了一个专栏,对前段时间的一些收获和知识点做一个系统性的归纳回顾和总结. 昨天也是刚刚写完了关于Java中的各种基础语言要素的总结,总觉得少了点什么. 对基础语言要素的理解和使用,实际上是很重要的. 俗话说,一切伟大的行动和思想,都源于一个微不足道的开始. 而对于一门语言来说,熟练的掌握对其基础语言要素的理解和使用,就是这个"微不足道的开始" 可以这样说,一门语言的基础语言要素,就等同于是一门武功的内

从“人、从、众”看社交网络的未来

什么是社交?社交是指社会上人与人的交际往来,是人们运用一定的方式(工具)传递信息.交流思想的意识,以达到某种目的的社会各项活动.社交是人的基本需求,而人是社交组成的元素之一. 社交网络是专注于让人们交流信息和建立线上互动的网络.它解决了距离问题,时间问题,还提供了许多消遣的东西,能够帮助人们交流. 在社交网络发展迅速的今天,人们越来越倾向用新媒介进行交往与对话,而不是传统意义上的面对面交流.人们对于社交的需求越来越大,越来越多的社交软件出现,很多软件公司也专注于对社交这块.要满足一个人的需求很容

使用原理视角看 Git

1. Git 的玩法 欢迎来到 Coding 技术小馆,我叫谭贺贺,目前我在 Coding.net 主要负责 WebIDE 与 Codeinsight 的开发.我今天带来的主要内容是 Git 的原理与使用. 谈起 git,大家的第一印象无非是和 svn 一样的版本控制系统,但其实,他们有着非常大的不同,至少 svn 没有像 git 一样这么多的玩法.下面我举几个例子,简略的说一下. 1.1 搭建博客 阮一峰将写 blog 的人分成三个阶段 使用免费空间,比如 CSDN.博客园.发现免费空间限制太