转自:http://blog.sciencenet.cn/blog-4673-512238.html,感谢分享!
人类行为的统计物理研究
人类行为具有高度的复杂性。研究人类行为中的规律,对于经济学、社会学、管理学的研究和应用有着极为重要的价值。长期以来,对人类的社会行为的研究主要为心理学所关注,通过心理学实验的方法,研究人类在各种环境下的心理反应是其主要的研究手段。 最近数十年来,人们在复杂系统研究领域内取得了令人瞩目的成就。复杂系统的研究具有着天然的综合性和交叉性,它所涉及的问题几乎遍及人们所研究的绝大多数领域,不但包括物理学、生物学等自然科学学科,也包括了经济学、社会学等社会学科。随着对复杂系统研究的不断深入,该领域的研究对各种社会学科的渗透越来越强烈,其理论影响和实际应用也越来越广泛。近年来,对人类行为的统计研究已经成为复杂系统中的一个重要议题。 不同于传统的心理学实验的方法,复杂系统研究者对于人类行为的研究主要通过统计物理的方法:通过对大量的人类行为事件进行定量统计,研究其中所隐藏的统计性规律,并根据所研究的问题,提出基本假设,建立理论模型,来探索这些规律的产生机制和可能的动力学影响。基于这样的研究方法,近年来人们发现了人类行为中所存在的大量的特殊的现象和规律,这些发现引发了人们对更深一步地探索人类的社会行为的热潮。特别是从2005年以来,仅在Nature, Science, PNAS,PRL等强影响因子期刊上就已经发表了三十余篇文章。
1,人类行为时间统计特性的实证研究
在以往一些的对社会、经济系统的研究中,常常把单个人的行为简化为可以使用泊松过程描述的稳态随机过程。这种假设必然导致的推论是人的行为的时间统计特征应该是较为均匀的,两个相继行为之间存在极大的时间间隔的概率很小。但是,自2005年以来,通过对电子邮件发送与回复、邮件通信等人类行为的时间间隔的实际统计,人们发现这些行为存在与上述假设极为不同的特性[1,2]:长时间的静默与短期内的高频率的爆发,同时呈现在这些人类行为中,其时间间隔分布存在满足反比幂函数的胖尾,也就是说,这些行为的发生过程是不能用泊松过程描述的。这一出人意料的研究结论提示人们,人类的个体行为可能存在复杂的动力学机制,而随之而来的一个重要的问题是,这种非泊松特性在人类行为中是不是普遍存在的?人们对这一问题进行了极为广泛的研究。
通过各种不同的数据收集方法,人们的研究涉及市场交易[3,4,5,6]、网站浏览[7,8],电影点播[9],欣赏网络音乐[10],手机通讯[11],在游戏及虚拟社区中的行为[12,13],计算机指令的使用行为[14]等,包含了商业行为、娱乐行为、日常使用习惯等众多的人类行为,在这些行为中,普遍发现有类似的偏离泊松过程的特性。这些现象显示出,除了受到生理周期强烈影响的部分行为外,时间间隔统计所显示的非泊松特性可能是在人类行为中普遍存在的。
除了时间间隔分布,部分人类行为事件前后时间间隔的相关性也得到了研究者的注意。研究发现,这些人类行为相邻时间间隔的相关性并不明显,而其他同样存在爆发性和长期静默性的自然现象(如地震等)常常存在正的相关性[15]。这一项研究初步把人类行为和其他复杂系统中的行为特性进行了比较,暗示可能存在统一的深层机制。
2,人类行为动力学模型研究
上述统计特性说明人类的众多行为是不能使用泊松过程来描述的,那么一个重要的问题是:这种胖尾分布的行为特征的来源是什么?目前的一种重要的解释是基于任务队列理论的[1,16,17,18],它把人的各种日常行为视作处理一系列的任务,并根据日常生活经验假设对这些待处理任务进行优先级划分,首先处理高优先级者,指出这种具有优先权的行为模式是造成胖尾分布的重要原因。这种基于任务队列的理论模型可以合理地解释很多人类行为中的非泊松特性,例如电子邮件和水陆邮件的发送等,而且可以相当容易的推广到存在多个个体之间的交互的情况[19],在解释人类行为时间统计胖尾分布特征方面取得了很大的成功。
此外,由于人类行为的复杂性,影响人类行为的因素是多种多样的,所以,有部分研究从不同于任务队列的方面出发,提出了多种非排队论模型。例如,有的工作考虑了人类行为中的记忆效应[20],有的研究了行为的周期性和季节性对非泊松机制的影响[21],近期的一种理论从多重泊松分布的角度解释了人类的行为特性[22]。
最后,国际上有少数工作研究了人类行为的非泊松特性对网络传播、通讯等动力学过程的影响。例如,发现相比于一般的泊送特性,这种非泊松特性可以给系统带来一些特殊性质,比如更快的传播速度等[23]。由于这一领域发展时间很短,在这一问题上还有海量的工作等待研究。
3,人类行为空间统计特性的研究
除了发现人类行为的时间间隔分布中广泛存在有非泊松特性,最近也发现在人类行为的空间分布中也存在有非泊松特性等复杂现象。2006年通过统计帐单传递[24],人们间接地发现了人类的旅行行程分布存在接近于幂律的胖尾;2008年,Gonzalez等通过统计移动电话用户在不同基站区域的漫游过程[25],更进一步的研究了人的旅行行程分布,同样发现该分布具有无标度特性,与早期的结果基本一致。更为直接的基于GPS数据的统计结论[26]也支持人类行程分布中存在无标度特性。此外,在生物学观测也发现大量的动物物种的运动具有类似的幂律形式的行程分布[27,28,29]。由于这种幂律形式的行程分布存在较高频率的远程运动,它无法通过经典的随机行走进行描述。这种行程分布的广泛性,使得人们需要去思考它背后的动力学机制是什么。虽然对于动物行为中的幂律行程分布已经提出了觅食效率优化[30,31]、嗅觉梯度机制[32]、确定性行走[33]等。目前对人类的这种行程分布模式的产生机制的解释方面的研究仍然是空白。在另一方面,由于这类非泊松特性常常会使得系统出现若干特殊性质,那么这种人类行为的空间分布上的非泊松特性同样可能影响到城市交通、人流控制、紧急避险等系统的运作,可能会使其带有若干特殊性质,这些问题目前尚未被研究,也值得研究者的注意。
4,人类行为动力学对传播的影响
人类行为的特性,不仅帮助人们更好的了解自己的行为特征,进一步挖掘这些统计数据背后所隐藏的人类特性,还关系到了人们对于多个方向的模拟和理解,其中讨论最多的,应属人类动力学对于疾病在人群中传播的影响。在这里主要从时间和空间两个方向来介绍人类行为对于传播的速度、波及的范围、预防的策略等的影响。
经典的疾病传播模型,都基于一些有悖于人类真实行为的假设:1、人活动的时间间隔相同,即所有人都均匀的在每个时间步活动一次,这里的“活动”,是指传播或康复的行为;2、所有人活动的频率在群体中是无差别的,即每个个体的活动密度一样。然而,参考前文人类时间间隔实证统计发现,这些假设与人类行为具有的阵发性、记忆性和活跃性有着很大的出入。
为关注人类活动的阵发性对于病毒传播的影响,Vázquez等人用人们查收E-mail的两组数据,分别为3188个用户之间发送的129135封邮件,1729165个用户之间互发的39046030封邮件,在实证数据的网络上,根据真实时间间隔,模拟了网络上计算机病毒的传播情况[43]。以天和小时为单位的统计结果,都表明人类行为的时间间隔满足幂率分布,会极大程度上减慢病毒的传播。人类活动的阵发性对于病毒传播具有明显的延迟作用。
文献[44]也运用SIR模型通过模拟,讨论了时间分布的阵发性对于传播过程的影响,设置了存在等待时间的模型,并得到结论:时间的异质性越强,病毒存活的概率越小。
在人类活动时间间隔满足阵发性的基础上,为探讨时间序列的记忆性对传播过程的影响,Karsai等人基于电话网络的实证数据,时间跨度为9个月,在规模为N=4.6×106的网络上模拟传播[45]。通过对比网络是否含权重、网络是否有向、通话时间分布是否有记忆性,模拟结果表明,人类行为时间和空间上的异质性会一定程度的减慢传播过程。
时间的异质性又体现在个体与群体两个层面上,也有工作进一步比较了二者对于疾病传播的速度的影响[46]。所谓群体层面的时间异质性,是指每个人活动的时间序列,间隔平均,而人与人之间的频率有较大差别,满足幂律分布,而个体层面的时间异质性,表现为人与人之间活动的频率相同,而单人活动的时间间隔满足幂律分布。群体层面上时间的异质性对传播速度的影响非常大,相比之下,个体层面上的对传播影响很小。
为了揭示人类的行程分布对于传播过程的影响,Ni等人利用连接概率与度成正比,与欧氏距离成反比的机制,构造网络,并在网络上模拟传播过程[47]。研究发现,行程分布的几何特征越鲜明,即人们更倾向于去到距离自己欧氏距离比较近的地方,病毒传播所波及的范围就越小,持续时间也就越短。
相比于个体形成分布的活动特征,更多人关注,在宏观的意义上,人类的长程旅行对于病毒在城市间扩散的影响。早在2004年,Hufnagel等人就在美国的航空网络上,假设人口密度随机分布,建立了SARS病毒传播的模型[48]。该模型考虑了局部病毒传播,和城市间由于飞行造成病毒传播两种因素,模拟出的结果与实证很好的吻合,并提出了有效地预防及抑制疾病传播的策略。针对以上模拟及解析结果,Hufnagel等人还提出了相应的预防策略,通过模拟,比较了减少局部地区个体接触和减少长程出行两种预防策略,得出孤立城市,即减少城市间的长程旅行可以更有效地防治疾病扩散,并给出了集中早期进行疫苗注射的显著效果[48]。此后,2006年Colizza 等人专门就人类长程出行的拓扑结构对于病毒扩散造成的影响进行了研究[49]。为了进一步探究网络的拓扑结构对于疾病人数分布的影响,还提出了病毒分布熵的概念,来刻画病毒流行的地区异质性。通过与实际网络病毒传播情况的对比,发现以前很多刻画人类行程拓扑结构的模型在细节上还需改进。
5,国内相关研究进展
该领域兴起也引起了国内研究者的注意。目前,中国科学技术大学复杂系统课题组、上海理工大学管理学院、上海交通大学自动化系等都已经有相关的研究论文在国内外学术期刊发表。这些工作可以简述如下:
在实证方面,中国科学技术大学复杂系统课题组的周涛等人与韩国成均馆大学及瑞典皇家学院合作研究了电影点播中的人类行为模式以及与个体活动性之间的关系[9,34], 洪伟等研究了人类短消息通讯中的时间间隔分布[35],发现了多种无标度特性;上海理工大学课题组的张宁、李楠楠和周涛合作分析了鲁迅、钱学森等名人的邮件通讯数据[36,37];上海交通大学的胡海波等人研究了网络在线音乐的收听行为[10]. 在理论模型方面,中国科学技术大学的韩筱璞等提出可自适应调节的兴趣机制来解释人类行为的非泊松特性[38,39]. 此外,上海理工大学方面还发表了针对人类动力学的中文综述[40],上海理工大学的郭进利等和中国科学技术大学的周涛等人合作编写出版了专著《人类行为动力学模型》[41],中国科学技术大学的周涛、韩筱璞、汪秉宏也在世界科学出版社出版的专著《Science Matters: Humanities as Complex Systems》中撰写了关于人类动力学研究的一个专门章节[42]。
6,面临的主要问题
由于该领域的发展时间短暂,目前在存在有大量的问题有待于深入的研究:
第一,已有的实证统计主要针对个体行为,但仍然存在大量的个体行为的特性并未被研究,已有的研究结果尚难以根据统计特性区分个体行为的主要类别;而针对团体行为的实证研究更几乎是空白。事实上,人类的行为常常受到起社会关系的影响,在这方面定量的实证研究仍然非常欠缺。另外,一些最近发展的理论,例如人类动力学的普适类假说,受到了新的实证数据的挑战,更清晰和令人信服的图景需要更多和更深入的实证分析。
第二,除了人类的个体行为,我们所做的一些最新的统计也发现,一些社会团体的宏观行为也具有类似的非泊松特性,例如国家之间的战争的时间间隔分布等;由于目前的实证统计有限,对于社会团体而言,这些特性在多大范围内存在,是否与人类个体行为具有相似的生成机制,都仍然是未知问题,需要进行深入的研究。
第三,在研究人类行为的空间分布方面,目前的实证数据全是根据帐单、手机漫游等数据间接获得的,缺少对人类行为空间分布的直接观察;而其产生机制和动力学效应方面的研究目前几乎没有。
第四,目前的理论模型研究,虽然已经提出了多种唯相机制来解释人类行为中的非泊松特性,但是这些机制难以覆盖全部的人类行为中的非泊松特性现象,需要新的更具有普适性的模型的提出。
第五,人类行为特性对各种社会系统的动力学效应的影响研究,尽管已经出现了少数这方面的研究,但是所涉及的问题众多,研究空白特别多,需要大量的工作深入进行。例如人类行为的空间分布特性是如何影响城市交通等。
[1] A.-L. Barabási, Nature 435, (2005) 207.
[2] J.G. Oliveira, A.-L. Barabási, Nature 437, (2005) 1251.
[3] V. Plerou, P. Gopikrishnan, L. A. N. Amaral, X. Gabaix, and H. E. Stanley, Phys. Rev. E 62, (2000) 3023(R).
[4] J. Masoliver, and M. Montero, Phys. Rev. E 67, (2003) 021112.
[5] M. Politi, and E. Scalas, 2008 Physica A 387 2025.
[6] Z. Q. Jiang, et al, Physica A, 387 (2008) 5818.
[7] Z. Dezs?, E. Almaas1, A. Lukács, B. Rácz, I. Szakadát, and A.-L. Barabási, Phys. Rev. E 73, (2006) 066132.
[8] B. Goncalves, and J. J. Ramasco, Phys. Rev. E 78, (2008) 026123.
[9] T. Zhou, H. A.-T. Kiet, B.J. Kim, and B.-H. Wang, Europhys. Lett. 82, (2008) 28002.
[10] H. B. Hu, and D. Y. Han, Physica A 387, (2008) 5916.
[11] J. Candia, M.C. González, P. Wang, T. Schoenhar, G. Madey and A.-L. Barabási, J. Phys. A: Math. Theor. 41 (2008) 224015.
[12] T. Henderson, and S. Nhatti, Proc. 9th ACM Int. Conf. on Multimetia, pp. 212, ACM Press 2001.
[13] A. Grabowski, N. Kruszewska, and R. A. Kosiński, Phys. Rev. E 78, (2008) 066110.
[14] S. K. Baek, T. Y. Kim, and B. J. Kim, Physica A 387, (2008) 3660.
[15] K.-I. Goh, and A.-L. Barabási, Europhys. Lett. 81, (2008) 48002.
[16] A. Vázquez, Phys. Rev. Lett. 95, (2005) 248710.
[17] A. Vázquez, J. G. Oliveira, Z. Dezs?, K.-I. Goh, I. Kondor, and A.-L. Barabási, Phys. Rev. E 73, (2006) 036127.
[18] A. Gabrielli and G. Caldarelli, Phys. Rev. Lett. 98, (2007) 208701.
[19] J.G. Oliveira, and A. Vázquez, Physica A 388, (2009) 187.
[20] A. Vazquez, Physica A 373 (2006) 747.
[21] A. Cesar, R. Hidalgo, Physica A 369 (2006) 877.
[22] R. Dean Malmgren, Daniel B. Stouffer, A. E. Motter and L. A. N. Amaral, Proc. Natl. Acad. Sci. USA 105, (2008) 18153.
[23] A. Vázquez, B. Rácz, A. Lukács, and A.-L. Barabási, Phys. Rev. Lett. 98, (2007) 158702.
[24] D. Brockmann, L. Hufnagel, and T. Geisel, Nature 439, (2006) 462.
[25] M. C. Gonzalez, C. A. Hidalgo, and A. -L. Barabasi, Nature 453, (2008) 779.
[26] L. Rhee, M. Shin, S. Hong, K. Lee K, and S. Chong, On the Levy-walk nature of human mobility, Proc. 27th IEEE Conf. Comput. Commun (INFCOM, IEEE Press, 2008).
[27] F. Bartumeus, F. Peters, S.Pueyo, C. Marrase, and J. Catalan, Proc. Natl. Acad. Sci. USA 100, (2003) 12771.
[28] G. Ramos-Fernandez, J. L. Mateos, O. Miramontes, G. Cocho, H. Larralde, and B. Ayala-Orozco, Behav. Ecol. Sociobiol. 55, (2004) 223.
[29] D. W. Sims, E. J. Southall, N. E. Humphries, G. C. Hays, C. J. A. Bradshaw, J. W. Pitchford, A. James, M. Z. Ahmed, A. S. Brierley, M. A. Hindell, D. Morritt, M. K. Musyl, D. Righton, E. L. C. Shepard, V. J. Wearmouth, R. P. Wilson, M. J. Witt, and J. D. Metcalfe, Nature 451, (2008) 1098.
[30] G. M. Viswanathan, S. V. Buldyrev, S. Havlin, M. G. E. da Luzk, E. P. Raposok, and H. E. Stanley, Nature 401, (1999) 911.
[31] F. Bartumeus, J. Catalan, U. L. Fulco, M. L. Lyra, and G. M. Viswanathan, Phys. Rev. Lett. 88, (2002) 097901.
[32] A. M. Reynolds, Phys. Rev. E 72, (2005) 041928.
[33] M. C. Santos, D. Boyer, O. Miramontes, G. M. Viswanathan, E. P. Raposo, J. L. Mateos, and M. G. E. da Luz, Phys. Rev. E 75, (2007) 061114.
[34] 周涛, 在线电影点播中的人类动力学模式, 复杂系统与复杂性科学 5(1), (2008) 1.
[35] W.Hong, X.-P. Han, T. Zhou, and B.-H. Wang, Chin. Phys. Lett. 26, (2009) 028902.
[36] 李楠楠,张宁,周涛, 人类通信模式中基于时间统计的实证研究, 复杂系统与复杂性科学 5(3), (2008) 43.
[37] N.-N. Li, N. Zhang, Tao Zhou, Physica A 387, (2008) 6391.
[38] 韩筱璞,周涛,汪秉宏, 基于自适应调节的人类动力学模型, 复杂系统与复杂性科学 4(4), (2007) 1.
[39] X.-P. Han, T. Zhou, and B.-H. Wang, New J. Phys., 10 (2008) 073010.
[40] 李楠楠,周涛,张宁, 人类动力学基本概念与实证分析, 复杂系统与复杂性科学 5(2), (2008), 15.
[41] 郭进利,周涛,李季明,张宁,《人类动力学模型》,上海系统科学出版社,香港 2008.
[42] T. Zhou, X.-P. Han, B.-H. Wang, “Towards the understanding of human dynamics”, pp. 207-233 (M. Burguete and L. Lam eds., “Science Matters – Humanities as Complex Systems”, World Scientific Publishing, Singapore 2008).
[43] A. Vázquez, B. Rácz, A. Lukács, A.-L. Barabási, Impact of Non-Poissonian Activity Patterns on Spreading Processes, Phys. Rev. Lett. 98, 158702 (2007).
[44] D. H. Zanette, Dynamics of rumor propagation on small-world networks, Phy. Rev. E 65, 041908(2002).
[45] M. Karsai, M. Kivelä, R. K. Pan, K. Kaski, J. Kertész, A.-L. Barabási, J. Saramäki,Small But Slow World: How Network Topology and Burstiness Slow Down Spreading
[46] Z. Yang, A. Cui, T. Zhou, Impact of Heterogeneous Human Activities on
Epidemic Spreading
[47] S. Ni, W. Weng, Impact of ttravel patterns on epidemic dynamics in heterogeneous spatial metapopulation networks, Phys. Rev. E 79,016111(2009).
[48] L. Hufnagel, D. Brockmann, T. Geisel, Forecast and control of epidemics in a globalized world, Proc. Natl. Acad. Sci. U.S.A. 101,15124(2004).
[49] V. Colizza, A. Barrat, M. Barthelemy, A. Vespignani, The role of the airline transportation network in the prediction and predictability of global epidemics, Proc. Natl. Acad. Sci. U.S.A. 103,2015(2006).
原文地址:https://www.cnblogs.com/baiting/p/11431620.html