当社交大数据遇到心理学,靠朋友圈就能云确诊抑郁了?

在人工智能的发展过程中,AI+一切大数据似乎都能提升效率,得到喜闻乐见的结果。可唯独有一样,结合了AI之后会造成大量负面影响,这就是社交媒体数据。

平时我们习惯了在社交媒体中表达情绪、表达兴趣爱好甚至会在不经意间透露自己的个人信息,作为普通人而言,即使知道这是一个开放的空间也不太会有数据泄露观感,毕竟大多数社交媒体的信息展示权重是按照信息热度来的,普通用户的个人发言很难被陌生人刻意看到。

但有了AI带来的超强算力和数据分析能力,一切就变得不一样了。在爬取数据之后,AI+社交媒体数据能看到的不仅仅是一个人对于事物的反应、情绪和表达,而是可以看到一整个群体甚至整个族裔的相关信息。前一阵差点搞垮Facebook的信息泄露门,多少就体现出了大量散乱个人信息面对AI可能产生的恶果。

不过社交媒体数据不仅仅有阴暗面,现在已经有不少神经学、心理学方面的研究开始利用上AI和社交媒体数据,用机器应对人性。

推特大数据告诉你,半夜矫情这件事全世界人民都一样

最近布里斯托大学就利用机器学习分析了英国57个城市四年内的8亿条推文,得出了一个让我们思考已久的结论——人类普遍在早晨情绪高涨、在深夜情绪低落。

整个分析过程是这样的,研究团队通过Twitter搜索API进行采样,收集到了8亿条推文。再从其中清洗掉所有#话题、表情符号、节日祝福语等等。并根据心理测量方式为单词设立了标签,比如情绪上的积极情绪与消极情绪;时间导向上的关注现在、关注过去、关注未来;个人关注中工作、家庭、金钱、社会、宗教等等。

有了这一严格根据心理学研究维度设立的机器学习模型,对于社交媒体数据的研究会更加专业化,而不是单纯靠NLP对语言文字中的情绪进行分析。

最终研究得出的结论是,在一天的24小时中,人类的情绪不仅仅会发生变化,思维模式也会随之改变。

从一天的5-6点开始,人们开始进入社交媒体的表达高峰期,并且这时人们的情绪表达更为积极,关注点也比较集中在个人状态上。随着时间推移到7-9点,人们的情绪开始偏向于愤怒,但如果是在非工作日,这种积极而愉悦的状态就会一直持续下去。这时人们的思维模式偏向于类别思维,想法更为清晰直接,逻辑性强,同时也会有刻板印象的倾向出现。

而到了深夜,人们的情绪表达就会转变为消极,同时关注点也会从个人转移到社会方面,随着时间推移,越接近第二天的凌晨3-4点,人们的关注点就越集中在宗教之上。这一时间段人们的思维模式偏向为存在主义,即体现出困惑、焦虑、非理性、更愿意参与和分享的状态。

用直白点的话说,一个人的大致状态是早上起来兴致勃勃充满自信,打了鸡血一样规划自己的人生,等到了晚上就开始心情低落胡言乱语,关注世界每个角落又发生了让人悲伤或感动的事情,如果深夜还睡不着,就开始寻求宗教的救赎了。看,这个过程是不是中国人外国人都一样?

当社交媒体成为心理学研究助手,从一张自拍就能确诊?

其实关于人类情绪的时间周期变化,在之间早就经过证实了。因为神经的疲劳、褪黑素分泌等等生理原因,我们的情绪会在一天之中呈现出不同的状态。虽然这次对社交媒体大数据的研究只是再次印证了这一变化,并没有挖掘出情绪变化的更多原因,但关于情绪周期和思维模式变化的关联,倒是第一次发现。

实际上对于社交媒体数据和心理方面的研究还有很多,从中挖掘到了很多有趣的的信息。

例如在去年,美国匹兹堡大学曾经进行过一项调查,调查内容是抑郁症患者的社交媒体使用状况,结果发现,抑郁症患者的社交媒体平均使用时长要比普通人高出不少。而哈佛大学的研究则表明,抑郁症患者在社交媒体发布照片时更倾向于应用冷色调、褪色或黑白滤镜。

突破不了的伦理关卡

目前来看,社交媒体数据对于心理学的作用似乎还停留在学术研究上,在我们的有生之年,可以看到社交媒体数据的心理学应用吗?

目前来看,社交媒体数据对心理学至少有以下几种应用途径:

1、 作为心理状态测量的辅助工具

除了那些直接导致幻听、失眠等等直接表现的心理疾病之外,还有很多类型或程度的心理疾病是很难客观感受到的。大多时候要靠面诊或填写心理状态测量表来确认,可患者自主填写时可能无法直接表现出自己的真实状态。这时社交媒体中无疑透露出来的信息就可以作为支撑。

2、 群体心理状态的评测

相比个体出现心理问题,更复杂的情况是一整个群体在经历例如灾难、意外时会产生的心理状态变化。比如在一个公司或学校中出现员工/学生自杀,或者一整个地区遭遇了地震台风等严重的自然灾害。这时我们往往是没有精力去为每一个人做心理咨询的,也没有办法整体评估群体的心理状况,顶多以集体课的形式对人群进行心理疏导。这时利用机器学习对社交媒体数据进行研究,就可以清楚的看到群体对于事件的心理状态反应。甚至对人群进行长期的心理状态追踪,并进行选择性、针对性的心理辅导。哈工大就曾经提出过一种方法,通过建立分类器对于高校学生的社交媒体数据进行研究,从而识别抑郁症患病几率。

实际上以上提到的应用方式,光从技术上来讲几乎没有实现难度。虽然得出的结果不一定绝对准确,但对于心理学这项劳动密集型产业来说,所能提供的价值非同小可。

但这其中最大的问题还是在伦理方面,公开发布的社交媒体数据究竟应不应该算个人隐私?从中提炼出的信息又算不算个人隐私?即使是心理疾病患者,公民应该拥有不披露自己患病状况的权力,通过社交媒体数据发掘公民的心理健康状况,是否严重侵犯了这一权力?尤其像在高校群体中应用这一技术,会不会有人因为周围老师、同学因为这种方式得知了自己的心理状态,而使心理状况变得更差?

其实在某种程度上来讲,我们有时候会刻意选择一些低效的问题解决途径,但可以换来心灵上的安全与自由。

原文地址:http://blog.51cto.com/naojiti/2131523

时间: 2024-10-09 07:54:25

当社交大数据遇到心理学,靠朋友圈就能云确诊抑郁了?的相关文章

大数据时代的“透明人” 好莱坞艳照门背后的云隐私

好莱坞艳照门背后的云隐私 如今“修电脑才可能泄露艳照”的时代已然过去了,现在的新名词是“云艳照”.从陈冠希开始,中国网友某种程度上是第一次熟知了艳照,而这一次,数十位好莱 坞一线女明星宽衣而来,让我们对大数据下的个人隐私问题再次产生忧虑,如果大数据作为一种技术,在未来统治了人们的工作和生活,那么我们在云端的隐私该如 何保护? 谁都可能是下一个泄露艳照的人 女星艳照是从哪儿泄露的? 涉事女星博文 就目前而言,讨论女星们为什么要拍这样的照片都是没有意义的,这个事情更值得细究的就是私人照片是怎么跑到公

社交关系与大数据的结合

大家还没搞清楚PC的时候,移动互联网来了,还没搞清楚移动互联网的时候,大数据来了. "有个不太靠谱的命题:如何让赵本山和迈克尔乔丹搭上关系?其实很简单,通过分析两个人的社交圈子,兴趣爱好等,最终可以找出一条线路能让他们两个人认识,这就是隐藏其中的大数据魅力之一点点-- 随着互联网的冲击,UGC(用户产生内容)不断发展,社交网络已经不断普及并深入人心,用户可以随时随地在网络上分享内容,由此产生了海量的用户数据.这些数据并不是我们想象中的那样冷冰冰.枯燥的数据,而是更加活生生.有趣的数据:这些数据不

预见未来—— 互联网大数据应用 商业计划书

内容说明: 本商业计划书是我去年时写的,比较粗浅. 但一文一图都是自己花了时间整理出来的,也是份劳动成果,现分享给大家. 粗陋简文,不当之处,请多指教! 互联网大数据应用商业计划书_v1.3.pdf   pdf版下载地址: http://ebigdata.net/bigdata.pdf 注:未经本人同意,禁止转载:联系作者:程序猿小伍 [email protected] 第1章 背景介绍 1.1. 大数据标签 一分钟内,微博推特上新发的数据量超过10万. 截至2015年6月,我国网民规模达6.6

关于电信运营商大数据应用的一点启发

作者:李福东(易仔阿克)    时间:2014年7月24日 这两天在51CTO上安了个家,写了一篇文章,输入文章标题,很快就被百度搜索识别,而同样的文章在其他几个知名网站的博客上也发表了,但是百度上并没有检索到,可见51CTO在互联网上的活跃度.嗯,为了表示一下我的好心情,索性再写一篇小文,关于电信运营商大数据应用方面的吧. 因为社会分工的不同,大数据势必会分散在不同行业的不同企业之中,比如银行拥有客户的存贷款记录,互联网电子商务公司拥有客户的网购记录,而电信运营商则有客户的通话.手机上网等记录

一篇文章告诉你大数据应该怎么学

最近不少网友向我咨询如何学习大数据技术?大数据怎么入门?怎么做大数据分析?数据科学需要学习那些技术?大数据的应用前景等等问题.由于大数据技术涉及内容太庞杂,大数据应用领域广泛,而且各领域和方向采用的关键技术差异性也会较大,难以三言两语说清楚,本文从数据科学和大数据关键技术体系角度,来说说大数据的核心技术什么,到底要怎么学习它,以及怎么避免大数据学习的误区,以供参考. 1.大数据应用的目标是普适智能 要学好大数据,首先要明确大数据应用的目标,我曾经讲过大数据就好比万金油,像百度几年前提的框计算,这

chinacloud大数据新闻

2015年大数据发展八大趋势   (0 篇回复) “数据很丰满,信息很骨感”:Sight Machine想用大数据的方法,打碎两者间的屏障   (0 篇回复) 百度携大数据"圈地"证券业 "BAT"开启互联网金融新战场   (0 篇回复) 码农的春天到了?   (0 篇回复) 浪潮大数据一体机出招 装备科研“最强大脑”   (0 篇回复) 方物软件承担国家“核高基”重大专项研发   (2 篇回复) 2013互联网大会透露的热点与新趋势   (1 篇回复) 大数据从幕

一篇文章为你解读大数据的现在和未来

大数据的发展前提 关于大数据的概念其实在1998年已经就有人提出了,但是到了现在才开始有所发展,这些其实都是和当下移动互联网的快速发展分不开的,移动互联网的高速发展,为大数据的产生提供了更多的产生大数据的硬件前提,比如说智能手机,智能硬件,车联网,pda等数据的产生终端.这些智能通过移动通信技术和人们的生活紧密的结合在一起,在人流.车流的背后产生了信息流,也就产生了大量的数据. 其次就是移动通信技术的快速发展,在2G时代,无线网速慢,数据产生也非常慢,数据体量也不够,所以还是无法形成大数据,而到

大数据究竟是什么?一篇文章让你认识并读懂大数据[转]

来源:互联网分析沙龙     日期:2013-11-10 在写这篇文章之前,我发现身边很多IT人对于这些热门的新技术.新趋势往往趋之若鹜却又很难说的透彻,如果你问他大数据和你有什么关系?估计很少能说出一二三来.究其原因,一是因为大家对新技术有着相同的原始渴求,至少知其然在聊天时不会显得很“土鳖”:二是在工作和生活环境中真正能参与实践大数据的案例实在太少了,所以大家没有必要花时间去知其所以然. 我希望有些不一样,所以对该如何去认识大数据进行了一番思索,包括查阅了资料,翻阅了最新的专业书籍,但我并不

一篇文章为你解读大数据的如今和未来

大数据的发展前提 关于大数据的概念事实上在1998年已经就有人提出了,可是到了如今才開始有所发展,这些事实上都是和当下移动互联网的快速发展分不开的,移动互联网的快速发展,为大数据的产生提供了很多其它的产生大数据的硬件前提,比方说智能手机.智能硬件.车联网,pda等数据的产生终端.这些智能通过移动通信技术和人们的生活紧密的结合在一起.在人流.车流的背后产生了信息流,也就产生了大量的数据. 其次就是移动通信技术的高速发展,在2G时代,无线网速慢.数据产生也很慢.数据体量也不够.所以还是无法形成大数据