三千臭皮匠:集体能否产生智慧?

  “三个臭皮匠,抵得上一个诸葛亮。”众人的智慧,就一定胜过个人的智慧吗?东吴的孙权帐下,高人策士满堂,哪个比臭皮匠差?诸葛亮孤身一人,却舌战群儒,以三寸不烂之舌,说得东吴联刘抗曹。这是怎么回事?

  假如孙权有三个信息来源,一是 3000 包括臭皮匠在内的普通人的集体选择,一是几十谋士的讨论结果,一个是诸葛亮一人的说法,那么他该听谁好呢?往复杂里说,我们是在说民主和集权的话题,是选举人团还是普选的问题,是精英和大众的问题。就事论事地简单说来,我们要看孙权到底要干吗,是要修鞋呢,选地方官呢,还是吴蜀联盟呢?目的不同,信息采用渠道也不同。若是要修鞋,一个臭皮匠,或许抵得上三个诸葛亮。 联系到 2014 年国庆前后在香港发生的事,我发现很多假设存在问题:从上面的立场考虑,为什么认为 1200 人的选举,就一定能选出听话的代表?难说。从抗议者的角度来看,是不是普选就一定能选出代表自己利益的人?这个“自己”又是谁?由于了解不多,我在此问题上没有明确的观点,但我觉得很多人没有反省诸多前提假设,就开始站队,也是不应该的。或许我们应该先考虑一下,到底什么样的体制,更能够激发出高明的选择来。

  《信息乌托邦》[1](Infotopia)是芝加哥大学法学教授凯斯· R· 萨恩斯坦(Cass R. Sunstein)所写的一部著作。他让人想到了诸葛亮和臭皮匠的老话题。无论是在公共还是私有领域,究竟什么样的信息最可靠,什么样的判断最准确,什么样的决策最合理呢? 萨恩斯坦提出了如下几种发掘集体智慧的办法(由于侧重网络时代的集体智慧,此书没有谈到集权式决策,这是一大遗憾):

  数字说了算   

  采集所有人的意见,取平均值,让数字来说话,这有时候是一个非常明智的做法。有人做过试验,让一屋子学生猜室内温度,最后取平均值,是华氏 72.4 度,几乎等同于实际温度( 72 度)。英国科学家 Francis Galton 在一次乡村集市上举办比赛,让人猜一头牛的体重,牛的实际体重为 1198 英镑,787 个参赛者猜后的平均值为 1197 英镑。由此看来,既然每个人都有误差,那么人数如果足够多的话,大家的误差应该相互抵消。是不是很有道理?

  这些都是温度、体重等简单事实,没有太多阐释色彩,集体的智慧此时显然是最靠得住的。另外一些情况则不尽然。如果集体智慧一定能产生最佳选择,那么为什么极有争议性的布什能够连任?一个可能的解释是:9/11 后,美国的政治总体气氛是趋向保守的,很多人也只关心自己本土能否得到保护。既然大部分人都带着这种心态去投票,那么选中他也不是什么稀奇事。萨恩斯坦提到了一个陪审团定律(Jury Theorem),很能解释上述集体选择的不同后果。根据此定律,如果集体中每个人回答时答案正确的概率超过 50%, 那么人越多,得到优质结果的可能性越大。比如三个臭皮匠每个人答案正确的概率为 67%, 那么两个臭皮匠在一起,按照少数服从多数的原则,正确的概率就是 74%(本书后附有一数学公式推算此结果),人越多,而且一直遵循少数服从多数原则,那么答案就越正确。所以一些“大赢家”之类电视节目中提出一些简单问题,竞赛者不知道怎么回答,他可以打电话问家人,也可以问现场所有观众。如果你家人确实见多识广,超过一般人,那么问他是对的。如果他只能给出和你一样随机的答案,那么问现场观众,请他们集体回答,往往是更好的选择。   

  反过来,如果每个人正确的概率低于 50%, 那么人越多,得到糟糕答案的可能性就越大。希特勒就是在群众的狂热中上台的。海选最好的情形,是大家没有先入为主的整体偏见,每个人的选择并非是随机选择,而是有了充分信息披露,大家能做明智选择(informed decision),那么群体决策就可能比随机的个人决策产生更好结果。   

  这个结论也我们想到现在常说的网络暴民现象:群体在偏见的引导下,形成一边倒的跟风式意见,让更为合理的声音(包括出色的专家)受到压制。这些年来,我们经常会看到,铺天盖地的“粉丝”们形成的舆论压力或语言暴力,使得发言都无法进行,更不要说对话了。网络这样的环境,本应是民主的环境,是可供所有年龄段和背景的人交流的一个场所,它如果沦落为某一个群体所独有,排斥多元的东西,那则是网络的失败。   

  市场说了算   

  产生良好信息、知识、决策的另外一种方法是将一个选择放到市场上去,让市场来选择,并优化某些参数或特征,这叫预测市场(prediction markets)决定论。人们进入市场并非随机性行为,而是在追求个人利益的最大化,从动机上说,个人不会轻易盲目选择,因此其选择多半不会随机。再者,多数人的失误,会被少部精明的投资者所利用。市场总体上说,是一个奖赏正确判断的地方,错误行为不会像集体决策时那样,有可能遭到惩罚、歧视、嘲笑、忽略。例如,在会议当中,你如果老是发表不同意见,可能会在组织中被孤立。换言之,不同而合理的意见未必能得到合理回报。出于自我保护,与会的人可能选择不发言,不提供自己更为高明的意见。

  而预测市场的机制就完全不同:在利益牵引下,市场对选择进行调节,最终让其归于合理,至少是市场所认为的合理。

  爱荷华大学(University of Iowa)所经营的爱荷华电子市场(Iowa Electronic Markets)就是一个预测市场。在这里,参与者可以对总统选举、某某公司什么时候上市、未来某日的微软股价等各种项目进行下注。该市场预测的结果大部分情况下超过专业调查公司。看到预测市场的威力,很多企业也开始在运用预测手段,指引产品开发和营销。比如 Google 的“Google 市场”就有各种预测,比如“30 天内所有 Gmail 用户数量”、 “中国项目何时开业”等等。预测就是员工内部下注,赢家可以获得一些象征性奖励。它并没有多少商业性,在指引公司业务上却有良好效果。同样的方法,现在也用在很多其它场合,例如好莱坞有奥斯卡奖的预测市场。

  不过,预测市场既然是无数人组成的,那么也就会出现上述人群统计同样的错误。最典型的例子就是股市,在牛市的时候,人们一窝蜂去选择选择某些股票,这是否说明股价就是对的,买股票的人就是对的呢?未必。否则就不会有股市泡沫和经济危机。

  团队说了算

  上述两种情况都是宏观的,个人和组织未必能改变这些规。一般组织不会轻易去找千军万马来做调查问卷,以作为决策依据。大型统计周期比较长,其结果作为描述的用途更多,预测和指引当下决策的可能性比较小。一般组织,包括决策结构在内,多采用专家谋划(expert deliberation)的方式。Deliberation 的意思是精心筹划,它不仅仅是指讨论,也可能包括集体决策的其它办法,比如集体投票、“头脑风暴”、德尔菲方法(Delphi method)[2]等等,所以萨恩斯坦用了一个比较笼统的词来概括,称之为 expert deliberation. 比如美国人要不要从伊拉克撤军,expert deliberation 的办法就是前国务卿贝克所领导的“伊拉克研究小组”(Iraq Study Group)。而开战前的国会辩论和投票也是一种精英群体的 Deliberation. 照说这样的决策中,参与者是专家,应该比一般人更有可能正确。不过,从伊拉克战争的例子上看,集体决策显然是失误了。包括希拉里在内,很多提出撤军者当初投的都是赞成票,这也一直是让布什政府所抓的一个把柄。

  作者在书中列出了集体谋划的几个例子,从中能看出集体谋划的一些特征。2005 年,科罗拉多州举办了一次民主试验,将 60 位分属保守派和自由派的人分成数组,讨论诸如“是否允许同性恋婚姻”之类敏感政治话题。讨论结束后,与先前结果对比,大家发现保守的更保守了,自由派更自由了,即出现了所谓的“两极化”(polarization), 既原先的所持的立场会强化。

  1961 年,肯尼迪总统也在中央情报局、美国空军的“谋划”之后,入侵古巴,结果大败。肯尼迪自己都说:“我怎么这么蠢,居然允许实施这样的决策呢?”[3]这是集体谋划的一个典型例子。另外一个例子就是美国航空航天局,由于大家意见统一,一些故障未被发现,有一个人提出了异议却被忽略,结果造成哥伦比亚号航天飞机爆炸。中情局也好,美国空军将领也好,航空航天局也好,都是些人中翘楚,怎么有时候决策或者计划反有漏洞呢?

  这里头有几个问题。一是当集体谋划的时候,会有两种情况导致失败。一是信息影响(informational influences),另外一个是社会压力(social pressures)。更进一步说,大家分享的信息不够多,一些人掌握一部分信息,另外一部分人掌握另外一部分信息。所以良好的决策,应该尽量形成更为广泛的信息披露,减少背景不透明(hidden profiles)的情形。这道理很简单,信息不对称,就没有足够的信心下判断,就更有可能跟从于了解更多信息的人。

  另外,在每个人提供自己意见的时候,可能会放大自己所掌握的那部分信息。如果是错误信息,那么错误也会被放大。问题一经发现,解决起来倒是很容易。很多会议之所以低效,就是因为大家掌握的信息不同,大家都是一头雾水跑过来,只是知道一星半点情况,结果当然提不出有价值的建议。更好的办法,应该是提前分享相关资料,让每个人做足了功课再来开会。

  社会压力的问题更为复杂。作者介绍,人们的观点会如同瀑布(cascade)一样传递。第一个讲话的人如果其地位很重要,其他人提出别的看法会遭到惩罚,或者嘲笑,那么他就有可能选择跟从,除非某些人的职责就是唱反调。古代皇帝身边尚有谏官,理论上说,这是为了修正可能出现的错误。而集体决策的时候,由于大家想当然认为集体自然会“集思广益”,反而轻忽了“持不同意见者”的作用。作者建议,为了消除集体决策中社会压力的不良影响,有很多事情可以做。比如找一个不是绝对领导的人来主持会议或其它谋划活动。会议之前宣布规则,比如鼓励不同意见,形成优质决策。会议中还可以任命一人担任“持不同意见者”(devil’s advocate), 专门提供对立的分析。最为重要的一点,是在谋划中,或者组织的文化当中,提供足够的奖赏或鼓励,让人们愿意披露自己所知道的信息。

  还有一个非常有效的方法,就是通过匿名手段来达成一致意见,比如不记名投票,德尔菲方法等等,这样可以缓解社会压力对个人参与的影响。不过作者也警告,如果你没有足够的信息来做出明确的判断,那么不如趁早明说,沉默是金。    

  网络说了算

  以上说法,同样适用于网络时代的民意征集和集体谋划。

  如斯蒂芬?库柏(Stephen Cooper)[4]一样,作者认为,博客,以及今日出现的微博客、轻博客、和微信(如下总称博客),可以提供一个非常良好的纠错机制,让博客彼此之间,博客和传统媒体之间相互作用,减少信息错误,提供更为优质的内容。书中举了很多例子,说明博客如何纠错,并影响到现实决策[5]。

  网络时代的开源式开发,也是一个集中群体智慧的办法。美国民主的奠基人托马斯?杰斐逊(Thomas Jefferson)的后人理查德·杰克逊(Richard Jefferson)就是开源的倡导者之一,他呼吁利用这种多数人的“潜在创造力”[6]。可是注意,这里说的是“潜在”创造力,而并非实际“创造力”。以上创造力的兑现,也一样得遵守上述原则。但是开源本身的前途也是开放的,比如最近,根据美国公共广播电台的报道(2007 年 3 月 12 日晨节目)[7],因一个 20 岁辍学大学生冒充神学教授发表维基条目被发现,维基百科(wikipedia)公司最近在讨论是否对内容贡献者的身份进行认定。此建议仍在争议之中,但是同样我们看到,Linux 等开源式操作系统,现在也有了专人批准(approval) 的过程。实施批准的可能不是一个人,而是一个小组,这实际上是多种方式的集合,也可能是网络发展下一步值得大家关注的一个新动向。

  网络时代也形成了一些特殊的激励模式,比如出现了一些在市场看来无法理解的“利他”( altruism)行为。本书一开始就说到了未来的“维基社会”,在这样的维基社会,要想真正让网络中的众人或者精英的小组发挥效益,可借用其“付出文化”(gift culture)。所谓付出文化,就是说一个人在社区的地位,不在于他控制的范围,而在于他付出的多少(social status is determined not by what you control but by what you give away.)为此,社区的参与者会“通过时间、精力和创意的付出,来争取社区的口碑。”[8]   

  同样,要想让各式各样的网络集体,如社区、专家维基、博客圈行之有效,则也必须让信息的披露扩大,同时,尽量缩减社会压力对个人参与的负面影响,不让少数人的意见、取舍、偏好瀑布一般,一层层传递下去。这种情况在美国已经出现,比如保守派博客的链接和回访,一般只指向同类博客。在中国也一样,一些媒体博客,只链接到同类媒体,形成一个个形成“蚕茧”(cocoon)。如此,网络就未必能提供最好的信息、知识、智慧。

  假设东吴谋士们都来建立各自的“网络存在”,形成一个圈子,大家之间言论越来越趋向统一,不同的声音被淹没,那么诸葛亮八成还会打败他们。下棋就是这样,99 年卡斯帕罗夫(Garry Kasparov)在互联网上和全世界的棋迷对局,历时四个月,结果还是卡斯帕罗夫胜。

  复杂事件的决策,涉及的规则和利益比下棋还要复杂。在是否联蜀抗曹之类问题上,如果东吴谋士们或者臭皮匠们能做到畅所欲言,把诸葛亮想到的方方面面都能想到,让和诸葛亮一样的高手能够脱颖而出,哪又会是什么局面呢?历史不容我们这样“事后诸葛亮”。不过放眼未来,我们能否像哈耶克所说的那样 ,利用适当机制,激活群众的智慧呢?倘能借助网络实现此目的,那真是功德无量。 注释:

  [1] Sunstein, C. R. (2006). Infotopia: how many minds produce knowledge. New York, NY: Oxford University Press.

  [2]又称专家调查法,美国兰德公司(Rand Corporation)首先使用,是通过匿名方法,多轮传递、综合专家意见,直至形成统一结论。   

  [3] Infotopia, 第 47 页。      

[4] 参见 Cooper, S. D. (2006). Watching the watch dog: bloggers as the fifth estate. Spokane, WA: Marquette Books.   

  [5] 详见 Watching the watch dog 中的详细描述。   

  [6] 转引自 Infotopia, 178 页。 

  [7] National Public Radio, 2007 年 3 月 12 日晨节目。

  [8] Infotopia, 173 页。

时间: 2024-12-27 22:36:50

三千臭皮匠:集体能否产生智慧?的相关文章

提倡“三个诸葛亮顶过一个臭皮匠”

在近日的课程开展过程中,小组合作学习方法的探索是重点.对于教师,需要在实践中学会应对各种问题:对于学生,也是这样.我们的学习,在单打独斗中经历的太久了.通过小组合作,让学习不顺利的同学能够及时得到帮助,而对学习顺利的同学,也有机会通过讲出来的方式,让自己对知识点的理解更加深入,同时锻炼更可贵的表达能力.合作能力.小组合作是解决问题的方式,将其附加功能发挥出来,将离我们的教育目标越来越近. 小组合作完成作业的理想的模式,是小组合作完成任务后,再通过组间互评,锻炼同学们学术评价的能力,实现将学习的全

臭皮匠高防服务器租用,托管,国内五星级顶级机房

重庆臭皮匠电子商务有限公司(www.cpjidc.com)整合了国内领先的IDC运营.防DDOS/cc安全服务. 智能DNS安防相关领域的专业公司 的技术及服务优势.目前在重庆.上海.浙江.湖南. 福州等地的技术研发中心拥有一支由多名网络安全专家.IDC运营 及云计算专家.软件 工程专家和项目管理专家组成的专业队伍,通过与全国多个省市的电信.联通运营商合 作建立起巨 大的云数据中心,全网带宽承载能力高达TB级别. 重庆臭皮匠电子商务有限公司是一家专业的互联网数据安全运营商,公司以运营互 联网安全

臭皮匠上道儿了——句子反转

今天早上开挂了,连续通过好多道题,要是6月份有这个水平就好了. 昨天晚上我们俩都签卖身契了,要去天子脚下闯一闯. 贴一道纪念6月份刚来就参加优招笔试的那天出现的第二题: 题目描述 将一个英文语句以单词为单位逆序排放.例如"I am a boy",逆序排放后为"boy a am I"所有单词之间用一个空格隔开,语句中除了英文字母外,不再包含其他字符 接口说明 /** * 反转句子 *  * @param sentence 原句子 * @return 反转后的句子 */

机器学习的哲学思想

原文出处:https://www.zhihu.com/question/267135168/answer/329318812 之前前读过一次这篇知乎文章,现在再次读来,感受很深,特别是妥协和矛盾,说的不就做推荐的人的日常工作么,泪奔. 再次摘抄下来,方便以后再读 不仅仅是机器学习,大部分理工科的思想都可以从文史学科的角度去理解.正所谓大道至简,很多道理是共通的**.本文的内容是从哲学角度看待机器学习.文章的结构如下: 天下没有免费的午餐-教条主义的危害 奥卡姆剃刀定理-少即是多 三个臭皮匠的智慧

Bagging(Bootstrap aggregating)、随机森林(random forests)、AdaBoost

引言 在这篇文章中,我会详细地介绍Bagging.随机森林和AdaBoost算法的实现,并比较它们之间的优缺点,并用scikit-learn分别实现了这3种算法来拟合Wine数据集.全篇文章伴随着实例,由浅入深,看过这篇文章以后,相信大家一定对ensemble的这些方法有了很清晰地了解. Bagging bagging能提升机器学习算法的稳定性和准确性,它可以减少模型的方差从而避免overfitting.它通常应用在决策树方法中,其实它可以应用到任何其它机器学习算法中.如果大家对决策树的算法不太

今天懒一次 豆瓣电影Top250

今天不写代码,休息一下 1 import requests 2 from lxml import etree 3 from urllib import parse 4 offset = -25 5 i = 0 6 url = 'https://movie.douban.com/top250?start=' 7 8 while offset < 225: 9 offset += 25 10 11 start_urls = (url+str(offset)) 12 headers = { 13 'U

项目架构

项目架构 阅读目录 前言 六边形架构 终于开始建项目了 DDD中的3个臭皮匠 CQRS(Command Query Responsibility Segregation) 结语 一.前言 上一篇我们讲了DDD的核心概念(附上链接),并且设计了我们的上下文映射图,那么接下来就准备开始立项了,本篇文章的部分知识点可能对一部分人来说比较基础,可以选择性的阅读. 在这之前我们平常用的最多的应该就是3层架构了,这里也不展开描述了,大家都是在3层的陪伴下一路走来的~ DDD所使用的传统分层架构是松散分层,也

一些简单的编程练习题

转载自 http://blog.jobbole.com/53039/ 每当成为入门CS课程(学生们学习编程语言的课程)的助教时,都困于提出好的练习题.Project Euler和类似的问题通常对初学者来说来难了,尤其是对于那些没有很强数学背景的同学. 在这篇文章中,Adrian Neumann 收集了一些从初级到高级逐级困难的练习题,适合刚开始学习编程的初学者.当有新的练习题时,Adrian 会及时添加.除了一些GUI问题外,练习题一般都是算法题,无需学习任何库就可以解决.课程练习题的困难程度有

排序算法总结----比较类排序

概述:排序算法可分为比较性的排序,以及运算性的排序:这里详细介绍这些排序的原理,性能,实现,以及应用场合. 前面是维基百科的介绍,这里介绍几个比较典型的算法. 理论 计算复杂性理论 大O符号 全序关系 列表 稳定性 比较排序 自适应排序 排序网络 整数排序 交换排序 冒泡排序 鸡尾酒排序 奇偶排序 梳排序 侏儒排序 快速排序 臭皮匠排序 Bogo排序 选择排序 选择排序 堆排序 Smooth排序 笛卡尔树排序 锦标赛排序 循环排序 插入排序 插入排序 希尔排序 二叉查找树排序 图书馆排序 Pat