在人工智能的发展过程中,AI+一切大数据似乎都能提升效率,得到喜闻乐见的结果。可唯独有一样,结合了AI之后会造成大量负面影响,这就是社交媒体数据。
平时我们习惯了在社交媒体中表达情绪、表达兴趣爱好甚至会在不经意间透露自己的个人信息,作为普通人而言,即使知道这是一个开放的空间也不太会有数据泄露观感,毕竟大多数社交媒体的信息展示权重是按照信息热度来的,普通用户的个人发言很难被陌生人刻意看到。
但有了AI带来的超强算力和数据分析能力,一切就变得不一样了。在爬取数据之后,AI+社交媒体数据能看到的不仅仅是一个人对于事物的反应、情绪和表达,而是可以看到一整个群体甚至整个族裔的相关信息。前一阵差点搞垮Facebook的信息泄露门,多少就体现出了大量散乱个人信息面对AI可能产生的恶果。
不过社交媒体数据不仅仅有阴暗面,现在已经有不少神经学、心理学方面的研究开始利用上AI和社交媒体数据,用机器应对人性。
推特大数据告诉你,半夜矫情这件事全世界人民都一样
最近布里斯托大学就利用机器学习分析了英国57个城市四年内的8亿条推文,得出了一个让我们思考已久的结论——人类普遍在早晨情绪高涨、在深夜情绪低落。
整个分析过程是这样的,研究团队通过Twitter搜索API进行采样,收集到了8亿条推文。再从其中清洗掉所有#话题、表情符号、节日祝福语等等。并根据心理测量方式为单词设立了标签,比如情绪上的积极情绪与消极情绪;时间导向上的关注现在、关注过去、关注未来;个人关注中工作、家庭、金钱、社会、宗教等等。
有了这一严格根据心理学研究维度设立的机器学习模型,对于社交媒体数据的研究会更加专业化,而不是单纯靠NLP对语言文字中的情绪进行分析。
最终研究得出的结论是,在一天的24小时中,人类的情绪不仅仅会发生变化,思维模式也会随之改变。
从一天的5-6点开始,人们开始进入社交媒体的表达高峰期,并且这时人们的情绪表达更为积极,关注点也比较集中在个人状态上。随着时间推移到7-9点,人们的情绪开始偏向于愤怒,但如果是在非工作日,这种积极而愉悦的状态就会一直持续下去。这时人们的思维模式偏向于类别思维,想法更为清晰直接,逻辑性强,同时也会有刻板印象的倾向出现。
而到了深夜,人们的情绪表达就会转变为消极,同时关注点也会从个人转移到社会方面,随着时间推移,越接近第二天的凌晨3-4点,人们的关注点就越集中在宗教之上。这一时间段人们的思维模式偏向为存在主义,即体现出困惑、焦虑、非理性、更愿意参与和分享的状态。
用直白点的话说,一个人的大致状态是早上起来兴致勃勃充满自信,打了鸡血一样规划自己的人生,等到了晚上就开始心情低落胡言乱语,关注世界每个角落又发生了让人悲伤或感动的事情,如果深夜还睡不着,就开始寻求宗教的救赎了。看,这个过程是不是中国人外国人都一样?
当社交媒体成为心理学研究助手,从一张自拍就能确诊?
其实关于人类情绪的时间周期变化,在之间早就经过证实了。因为神经的疲劳、褪黑素分泌等等生理原因,我们的情绪会在一天之中呈现出不同的状态。虽然这次对社交媒体大数据的研究只是再次印证了这一变化,并没有挖掘出情绪变化的更多原因,但关于情绪周期和思维模式变化的关联,倒是第一次发现。
实际上对于社交媒体数据和心理方面的研究还有很多,从中挖掘到了很多有趣的的信息。
例如在去年,美国匹兹堡大学曾经进行过一项调查,调查内容是抑郁症患者的社交媒体使用状况,结果发现,抑郁症患者的社交媒体平均使用时长要比普通人高出不少。而哈佛大学的研究则表明,抑郁症患者在社交媒体发布照片时更倾向于应用冷色调、褪色或黑白滤镜。
突破不了的伦理关卡
目前来看,社交媒体数据对于心理学的作用似乎还停留在学术研究上,在我们的有生之年,可以看到社交媒体数据的心理学应用吗?
目前来看,社交媒体数据对心理学至少有以下几种应用途径:
1、 作为心理状态测量的辅助工具
除了那些直接导致幻听、失眠等等直接表现的心理疾病之外,还有很多类型或程度的心理疾病是很难客观感受到的。大多时候要靠面诊或填写心理状态测量表来确认,可患者自主填写时可能无法直接表现出自己的真实状态。这时社交媒体中无疑透露出来的信息就可以作为支撑。
2、 群体心理状态的评测
相比个体出现心理问题,更复杂的情况是一整个群体在经历例如灾难、意外时会产生的心理状态变化。比如在一个公司或学校中出现员工/学生自杀,或者一整个地区遭遇了地震台风等严重的自然灾害。这时我们往往是没有精力去为每一个人做心理咨询的,也没有办法整体评估群体的心理状况,顶多以集体课的形式对人群进行心理疏导。这时利用机器学习对社交媒体数据进行研究,就可以清楚的看到群体对于事件的心理状态反应。甚至对人群进行长期的心理状态追踪,并进行选择性、针对性的心理辅导。哈工大就曾经提出过一种方法,通过建立分类器对于高校学生的社交媒体数据进行研究,从而识别抑郁症患病几率。
实际上以上提到的应用方式,光从技术上来讲几乎没有实现难度。虽然得出的结果不一定绝对准确,但对于心理学这项劳动密集型产业来说,所能提供的价值非同小可。
但这其中最大的问题还是在伦理方面,公开发布的社交媒体数据究竟应不应该算个人隐私?从中提炼出的信息又算不算个人隐私?即使是心理疾病患者,公民应该拥有不披露自己患病状况的权力,通过社交媒体数据发掘公民的心理健康状况,是否严重侵犯了这一权力?尤其像在高校群体中应用这一技术,会不会有人因为周围老师、同学因为这种方式得知了自己的心理状态,而使心理状况变得更差?
其实在某种程度上来讲,我们有时候会刻意选择一些低效的问题解决途径,但可以换来心灵上的安全与自由。
原文地址:http://blog.51cto.com/naojiti/2131523