朋友圈中,谁是最有影响力的人?是你么!!

背景知识:社交网络分析、数据挖掘、IBM SPSS Modeler

社交网络分析(Social Network Analysis) 是指基于信息学、数学、社会学、管理学、心理学等多学科的融合理论和方法,为理解人类各种社交关系的形成、行为特点分析以及信息传播的规律提供的一种可计算的分析方法。

图 1 是社交网络的一个示意图,其中的节点可以是组织、个人、网络ID 等不同含义的实体或虚拟个体;连线表示节点之间的关系或信息流动。信息流动的方式有很多,比如邮件,电话,短信,博客,等等。假设 A 经常与 B 和 C 通电话,通过分析 A 的电话 ID 记录,可以构筑出图 1 中的简单社交网络。从此图中我们可以看出 A, B, C, 三人中,A 具有较强的影响力。如果 A 获得了正面或者负面的消息,这消息会很快传递给 B 和 C。而 B 与 C 之间的影响力是间接的,只能通过 A 来传播。

图 1. 社交网络示意图

随着节点和连线的增加,社交网络的复杂程度迅速提升。图 2 展示了一个较为典型的社交网络。大型和超大型的社交网络的处理是手工分析方式无法完成的。在过去的二十年中,社交网络分析领域的快速发展,很大程度得益于计算机计算能力的提升和各种数据挖掘方法的发展。

图 2. 一个典型的社交网络

数据挖掘 (Data Mining) 是从大量的、不完全的、有噪声的、模糊的、随机的数据中提取隐含在其中的、人们事先不知道的、但又是潜在有用的信息和知识的过程。从商业角度去定义,数据挖掘是一种新的商业信息处理技术,其主要特点是对商业数据库中的大量业务数据进行抽取、转换、分析和其他模型化处理,从中提取辅助商业决策的关键性数据。在技术上可以根据它的工作过程分为:数据的抽取、数据的存储和管理、数据的展现等关键技术。

图 3. 数据挖掘

被誉为第一数据挖掘工具的IBM SPSS Modeler( 原名 Clementine) 是 IBM SPSS 的核心挖掘产品,它拥有直观的操作界面,自动化的数据准备,和成熟的预测分析模型。使用它,企业可以将数据分析和建模技术与特定的商业问题结合起来,找出其他传统数据挖掘工具可能找不出的答案。

图 4. IBM SPSS Modeler 的操作界面

IBM 两种社交网络分析的算法原理

社交网络分析(SNA)是IBM SPSS Modeler 的常用功能,目前有两种算法支持这个功能,分别称作 GA 和 DA。GA 全称 Group Analysis, 是一种基于群体的分析方法。DA 全称 Diffusion Analysis,着眼于计算一些人的行为对网络中其他人的冲击强度。在 Modeler 中这两个算法以两个源节点的形式出现,如图 5 所示。

1. 根据共有邻接节点的数量,量化各个节点(也就是张三、李四、王五。。。)之间联系的强度;

图 5. GA 和 DA 在 Modeler 15 中以两个源节点的形式出现

下面我们简单介绍一下两者的算法原理。假设我们有过去半年里某地区的电话清单,数据量在百万到千万条左右。数据记录了打电话的人和接收的人,如图 6 所示。

图 6. GA 和 DA 的输入数据 -- 电话清单举例

GA 收到这些数据后,会进行如下的分析:

2. 保留高强度的联系,去除低强度的联系。进行此步骤后,社交网络会退化成几个内部联系多、外部联系少的次网络,以及很多孤立的节点。每个次网络对应一个群体(group),称为这个群体的核 (kernel);

3. 把那些孤立的节点连到距离他们最近的群体去。上一步里暂时去除的低强度的联系,在这一步发挥了主要作用;

4. 对各个群体以及群体里的个体进行分析画像,例如评估群体内每个个体的地位,找出“领袖”,计算群体密度,等等。这些特性将用于后继应用中,下一节的实例中会进一步展示。

相比之下,DA 的算法原理要更简单一些。DA 不会将网络分成群体,而是在原网络上进行计算。DA 着眼于计算一些人的行为对网络中其他人的冲击强度。

收到如图 6 的数据后,DA 会构筑一个有向加权网络,如图 7 所示。网络中的节点代表人、组织、计算机或者其他信息或知识处理实体;连线表示节点之间的关系或信息流动;连线的方向表示了关系的主动被动方,或者信息流动的方向(通常为双向,图 7 省略了此内容)。

DA 还需要有行为发生的人的名单。这里的行为可以是从公司辞职,更换手机服务商,试用了某种产品,等等。这些人被称作“初始扩散点”(Initial diffusing seeds),由图 7 中的红色节点表示。接下来,设定初始扩散点的冲击强度,然后采用衰败扩散过程就可以估计出其他节点所受到的冲击大小。

图 7. DA 算法解析

社交网络分析实例:客户流失预警和病毒式营销

1.客户流失预警

最近二十年中,移动通信成为占主导地位的通信介质。在许多国家,特别是发达国家,市场规模已达到饱和的程度,新客户的获得主要靠从竞争对手那里赢得。同时,公共法规和移动通信的标准化,让客户可以轻松地从一个运营商换到另一个,令市场极不稳定。由于赢得一个新客户的成本远远高于维护一个现有客户的成本,移动运营商更加重视客户保留的问题。因此,客户流失预警已成为一个关键的移动商务智能(BI)应用程序。

传统的客户流失预警解决方案直接采用数据挖掘技术,根据客户的呼叫模式(通常由数百个变量描述)构建客户档案,然后基于某些代表性属性预测客户的流失概率。可用于建模的数据源有很多,包括使用历史,结算,付款,客户服务,应用程序,和信用卡资料。

社会网络分析可以补充和加强传统的解决方案,使运营商能更根据“早期预警”,更有效地找出潜在的流失客户,提高保留率。例如,一个客户的亲密朋友流失,社会网络分析会及时推断出这个客户很可能是潜在的流失目标。而传统的解决方案寻找潜在流失目标时,需要等到这个客户有显著的变化(例如减少支出,预付费卡,不充电等)- 这种时候,她的流失很可能已经无法挽回了。

(1)使用 GA 进行客户流失预警实例分析

图 8 至图 10 演示了一个用 GA 进行客户流失预警的实例。在图 8 中,GA 源节点接收到一个如图 6 所示的 CDR 源文件。为方便起见,我们将 GA 源节点的名字直接显示为 CDR 源文件的名称 Demo_CDR. GA 源节点使用 GA 算法进行群体的划分,并计算出基于群体的各种特性值。完成对源文件的分析计算后,计算结果以数据文件的形式被保留在 Demo_GA_KPI。

图 8. Modeler 流:用 GA 源节点生成特性数据

图 9 展示了图 8 中 GA 源节点对其接收到的 CDR 源文件的分析结果。图的左侧是关于群体和个体特征的简单统计信息,而右图给出了对应特征更加详细的统计描述。用户可以据此了解群体分析的结果,从而修改相关参数以实现最理想的群体划分和画像。

图 9. 用 GA 源节点生成的特性数据

在图 10 中,我们将利用 GA 分析结果进行建模,用于预测每个客户所在群体的流失风险。我们用之前由 GA 源节点所产生的数据文件 Demo_GA_KPI 作为源节点。另外,我们还需要一份已流失客户名单Demo_GA_churner。如果一个组里已流失客户占总客户的比例达到一定程度,我们就认为这个群体为流失高危群体,否则为低危群体。图 10 中左下侧的模型以流失高 / 低危群体作为目标变量,用 Demo_GA_KPI 里所包含的群体特征值,以及通过对个体特征值的处理得到的辅助群体特征为预测变量,采用 CHAID
算法进行建模。

图 10. Modeler 流:用 GA 源节点生成特性数据和已流失客户名单建模,量化预测各个群体的流失风险

群体的流失风险对于群体中个体的流失与否是一个非常重要的参考因素。另外,个体在群体里的角色,地位,等等因素也在一定程度上影响着个体的流失风险。鉴于此,我们将所有这些因素作为预测个体流失的变量,从而得到预测个体流失的模型,如图 10 右侧的流所示。

需要注意的是,在上述建模过程中我们仅仅使用了用户通话记录和客户流失记录就可以预测群体以及个体的流失风险。然而通常情况下,我们可以有更多的关于用户人口统计学和消费行为的数据,而这些数据将极大的提升客户流失预测的精度。

(2)使用DA进行客户流失预警实例分析

与 GA 不同,DA 源节点不仅需要一个如图 6 所示的 CDR 源文件,还需要一个“初始扩散点”(Initial diffusing seeds) 的文件,也就是流失客户的名单。

DA 源节点使用 DA 算法进行扩散分析,从而计算出网络中个体受到初始扩散点的冲击强度。冲击强度的大小将直接影响着个体的流失风险。DA 输出的特征以数据文件的形式保存下来,并可在随后应用于生成图表或建立模型。图 12 集中展示了使用 DA 源节点产生的特性文件生成分析图表的一个典型数据流。

图 11. Modeler 流:用 DA 源节点生成的特性数据量化预测客户流失风险

2.病毒式营销

病毒营销是营销技术的一种。它利用社交网络提升品牌知名度或实现其他目标(如产品销售)。具体的方式是发起人给一些用户发出产品的最初信息,再依靠用户自发的口碑宣传,“让大家告诉大家”,使其广泛传播。因为它的传输策略是利用快速复制的方式将信息传向数以千计、数以百万计的受众,类似于自然病毒和电脑病毒,所以被经济学家称为病毒营销。

采用群体分析和扩散分析技术,我们可以设计出一个更为精致的病毒性营销策略。我们会识别出群体中的“领袖人物”:那些对周围人影响力大的人,将产品信息发布给他们。借助这些人的影响力,产品的信息可以更为有效的在社交网络中传播。我们还可以通过扩散分析技术去量化评估信息传播的效果。比如,takingtaking 推出新产品,我们可以做如下的工作:

1. 通过 GA 进行网络分析,发现领袖人物。

2. 针对网络中的领袖人物发布产品信息,促使他们支持和推荐新产品。

3. 选择网络中的领袖人物作为初始传播种子,通过 DA 进行扩散分析,估算网络中其他个体购买新产品的可能性。

4. 针对扩散分析预测出的最有可能购买新产品的客户,营销人员进行进一步的推销工作,使得新产品市场导入成功率明显改善。

总结

本文介绍了 Modeler中两种 SNA 模块 GA 和 DA 的算法原理 , 并讲解了它们在客户流失预警和病毒式营销两种典型应用。

应用于客户流失预警时,GA 以海量的通话记录为输入,构建出社交网,然后将其分解为群体,计算出包括群体领袖在内的一系列特征值,用于后续建模。DA 则根据海量通话记录和流失客户名单直接在社交网络上对其他客户所收冲击进行分析。

GA 和 DA 可以结合起来应用于病毒式营销的筹划和分析。其中 GA 用于发现社交网络中具有强大影响力的个体,而 DA 用于评估出最有可能购买新产品的客户。

值得一提的是,GA 和 DA 提供的一系列特征可以和传统的特征无缝链接。新特征的引入有助于提高基于传统特征的模型的性能。这一点在我们做过的很多试点项目中得到验证。另外,我们也期待随着社交网络这一新兴事物的发展,GA 和 DA 能够在更多的领域得到应用。

SPSS Modeler 试用版下载地址:
http://bigdata.evget.com/product/168.html

时间: 2024-10-12 16:38:18

朋友圈中,谁是最有影响力的人?是你么!!的相关文章

怎么样在【微信会员】朋友圈中获得更多的赞?

微信已经是我们生活中必不可少的生活.交流平台.微信会员在朋友圈中的分享.倾诉更是我们心灵平台,在微信朋友圈中被点赞多的洋洋得意,获赞少的难免失意.怎么样才可以让自己在朋友圈中获得更多的关注和点赞?朋友圈吸赞方式一:自拍如果你是男神或女神,如果你360度自拍无死角,那么发自拍照就足以获得一片“赞”声.那些明恋或暗恋的粉丝就可以顺理成章地用点赞来求关注了.也许点赞还不够,再加一句评论“美爆了”.“帅哭了”来表达激动的心情.请注意,矮矬穷.颜值负分者,请自觉跳过这一招式.朋友圈吸赞方式二:炫富对于一般

谈谈微信针对朋友圈中投放广告的营销方案

鉴于朋友圈的巨大流量和高频的访问,微信终于忍不住要开始朋友圈掘金了,几天前微信已经在朋友圈中插入了广告声明,昨天微信已经正式开始投放广告了. 广告是以类似facebook,微博的信息流的形式展示的,首批广告主分别是宝马.vivo手机和可口可乐.在投放广告之后几个小时之内,朋友圈就宣起了对广告内容和目标群体的广泛讨论.话说是微信是这么搞的:微信后台广告系统通过用户之前的访问日志,访问内容,朋友圈交互频度.自己发布的信息内容.以及地域.性别 甚至 手机客户端类型做了大数据分析,将人分为了三六九等,然

如何让你的网页链接潇洒地在微信好友和朋友圈中传播

嗨,大家好,我是大花猫! 想必大家都在自己的微信朋友圈看到过别人分享的一些网页链接消息,但是你注意了吗?有些链接的图标是用的微信一张蓝色的默认图片,但是有些链接的图标却有着各自专门的图标(注:公众号的图文消息不在本文讨论行列中.),而且标题也和链接里面网站的标题不一样!(想想前段时间那个风靡朋友圈的贱贱的神经猫吧!)好啦!今天要跟大家分享的就是如何让自己的网页在微信分享朋友圈中拥有一个自己个性的图标以及自定义分享中的描述文字.(开始想着加这个功能是在学习了慕课网的<2048私人定制>以后做了第

朋友圈营销中的7大核心错误 你中枪了吗

1.你的朋友圈里分享的全是广告 砰!中枪了吗? 这是80%微商犯的第一个错误就是,朋友圈里都是广告.产品.找代理.团队培训.收入截图.转账截图.发货...... 一照面就觉得你很讨厌,只要一接触你就知道你要卖东西给我,就像有一种男人,女孩一看到就知道他的目的是为了和我开房.满身散发着猥琐的气场.导致的结果就是我不想接触你. 我都不想接触你了,你还想让我买你东西?买你东西我都不愿意,你还想让我做代理? 是你疯了还是我疯了? 2.给人的感觉像是菜市场 什么意思?好的朋友圈应该像电视剧一样,让人有画面

如何在App中实现朋友圈功能之一朋友圈实现原理浅析——箭扣科技Arrownock

如何在App中实现朋友圈功能 之一 朋友圈实现原理浅析 微信朋友圈.新浪微博.知乎等知名朋友圈类型功能,大家有没有想过其实现的逻辑呢? 本文以微信朋友圈功能为例,解析实现逻辑. 朋友圈的结构: 朋友圈从总体上来说会分为6块结构,分别是墙.用户.图片.墙贴.评论与点赞. 墙:一块公共的墙,所有的墙贴都位于其上,如果APP只实现朋友圈功能,那么墙贴其实是可以不用的,但是如果APP要实现朋友圈.新闻圈等等其他各种墙贴类型消息的话,那么墙就显得很有必要了,这时候我们需要通过建立不同的墙来展示不同类型的墙

如何在App中实现朋友圈功能之二快速实现用户信息的自定义——箭扣科技Arrownock

如何在App中实现朋友圈功能 之二 快速实现用户信息的自定义 自我关联社交元素: anSocial中很多的社交元素API,如帖子(Post).相册(Album).文件(File)等,这些API的可选参数中允许传入其他社交元素的id. 当我们传了这些id时,服务器数据库里保存的是id,但是在返回结果里,会将这些id以对象的形式返回. 这样就大大提升了查询效率,原本需要查询两次的功能,现在可以一次实现,比如接下来要说的用户头像功能开发里可以利用的字段. 用户头像: 当我们在APP上创建用户,需要调用

如何在App中实现朋友圈功能之三快速实现双向好友功能——箭扣科技Arrownock

如何在App中实现朋友圈功能 之三 快速实现双向好友功能 在社交APP的使用中,用户相互添加好友是一个必要的场景,本期技术分享在这里给大家介绍如何利用AnSocial的Friend来实现微博粉丝和微信好友机制. 微博粉丝机制: 微博是一个单向的好友关系链,从单个用户出发,他拥有关注者和粉丝.利用Friend可以实现以下场景:用户A关注了B,用户C关注了A,即B拥有粉丝A,A拥有粉丝C. 具体实现方式: 用户A关注B,调用新建Friend(friends/add.json),参数中target_f

如何在App中实现朋友圈功能之五点赞、评论属性详细解析——箭扣科技Arrownock

如何在App中实现朋友圈功能 之五 点赞.评论属性详细解析 快速查看评论和点赞数量: 当我们创建一个墙贴后,这个墙贴会自动带有评论数量commentCount.赞数量likeCount.讨厌数量dislikeCount三个属性. 当有用户对这个墙贴进行了评论,该墙贴的commentCount属性会自动增长,无需开发者来手动操作实现. 如果用户建立的Like中like=true,那么likeCount会自动增长,反之,dislikeCount会自动增长. 如果用户把评论删除了,或者是把点赞撤销了,

如何在App中实现朋友圈功能之七快速实现上拉加载朋友圈功能——箭扣科技Arrownock

如何在App中实现朋友圈功能 之七 快速实现上拉加载朋友圈功能 逻辑分析: 取出缓存postList里的最后一条数据postList a. 如果lastPost存在,说明缓存里有数据,接着取出数据库中与lastPost时间最接近的一条latestPost,以它们的created_at作为关键查询条件,去服务器取limit条(比如10)数据: 1. 如果服务器返回的Post数量大于0,将Post存入数据库,之后需要做两个查询动作: 查询出新的Like和Comment:根据本地数据库里的最新一条Li