从新手运气到幸存者偏差

从新手运气到幸存者偏差

Esri 中国 卢萌

赌徒都相信“初学者总是有运气”的。几乎所有的赌徒都认为“虽然后来运气会慢慢变差,但是刚开始赌的时候总是很走运的”。

抛开职业赌场,庄家放长线吊大鱼的不算。就算在股市上也经常有这种案例,新人入行的时候,运气都特别的好。

是否真有新手运气这一回事呢?在讨论这个问题之前,我们先来看看统计学里面的一个专业名词“幸存者偏差(Survivorship bias)”,另外也有译为“生存者偏差”或“存活者偏差”,是一种常见的逻辑谬误(“谬误”而不是“偏差”),意思是只能看到经过某种筛选而产生的结果,而没有意识到筛选的过程,因此忽略了被筛选掉的关键信息。这东西的别名有很多,比如“沉默的数据”、“死人不会说话”等等。

他最早来源二战时候的一个故事。

第二次世界大战时候,美英联军对德国展开战略大轰炸,因为德军的防空火力空前强大,所以盟军的飞机损失惨重。空军和飞行员都强烈要求增强战斗机的防护能力,最简单的方法就是在飞机上加装防弹装甲。

但是二战时候的飞机发动力马力有限,如果全部加装装甲,那么就会整个机体都超重,导致起飞困难和操作迟钝的问题。所以只能局部加装防弹装甲。

军方邀请了哥伦比亚大学的著名统计学家亚伯拉罕.沃德(Abraham Wald)教授,对德军防空火力击中的联军飞机进行分析。

沃德教授给飞机维修人员发放一张统计表格,让他们在表格上把飞机中弹的部位画出来。经过一段时间后,汇总成了两张表格,其中,机翼上的中弹点最多,而发动机和飞行员座舱基本上是空白,几乎一弹未中。

军方负责人看见这份统计报告之后,马上决定,把装甲安装在机翼上。但是沃德教授马上制止了军方的决定。

因为沃德教授认为,这份统计报告,是我方的维修人员,从飞回来的飞机上统计出来的结果。也就是说,虽然机翼中弹很多,但是中弹之后还能够顺利返航,恰恰说明机翼并非最需要防护的部分。而发动机和驾驶舱完全没有中弹的记录,是因为,只要这两个地方如果中弹,飞机几乎百分之百的坠毁了。所以,发动机和驾驶舱才是最需要防护的部分。

被击中了发动机和驾驶舱的飞机,都被击落了所以没有进入到被研究的样本中。它们都变成了“不会说话的死人”。

这种现象,就是统计学里面的幸存者偏差现象。当你收集的数据的前提若有错误的时候,再漂亮的统计算式或方法、再多的资料,也不能让后面的推论变得正确。

如此看来,前面我们所见的“新手幸运“说,就是一种幸存者偏差现象。

首先我们都知道,在赌场,或者在股市,赌徒都是处于劣势,赌场或者说庄家都是处于优势地位。那么首先去赌的话,如果赢了(走运),那么大部分这样新手赌徒,都认为自己受到了命运的垂青,而会继续赌下去。

输了的那些呢?他们可能会感到失望,然后停止赌博,因此,当赌徒的样本被统计的时候,这些离开了赌桌的失败者,就不会出现在样本中。

失败者可能会去看鸟、涂鸦、当海盗,或是从事其他的消遣活动。而继续赌博的人会记得自己曾经是走运的新手。放弃了赌博的人,从定义上将已经不是属于赌徒的行列了,所以统计的时候,凡是赌徒,都是属于幸运的新手的状态。

台大刘顺仁教授在著作《决胜》一书中, 对“幸存者偏差”举例说明,是最生动贴切又清楚的一个。

他讲了一个这样一个骗钱的例子(这已经进化到E-mail版)。

1月2日你接到一封匿名信,这封信向你表示,这个月市场会上涨,结果是市场果然上涨,但你不以为意,因为大家都知道有元月效应这回事(历年来一月间股价涨多跌少)。

到了2月1日,你又接到另一封信,向你表示,市场将下跌。这一次,又给那封信说中了。

3月1日再接到一封信,情形一样。这样的话你对那位匿名人士的先见之明很感兴趣,然后对方邀你投资某个海外基金。

于是你把全部的储蓄拿出来投资, 两个月以后,那些钱有如肉包子打狗,一去不回。你伏在邻居的肩膀上嚎啕大哭,他告诉你,他也接过两封这种神秘信,但寄到第二封就停了。他说,第一封信的预测正确,但第二封不正确。

这是怎么一回事?

那些骗子玩的把戏是,他们从电话簿找出一万个人名,寄出后市看涨的信给其中一半的人,后市看跌的信给另一半的人。

一个月后,将有五千人接到的信预测正确, 然后再针对这五千人如法炮制。

再一个月后,剩下二千五百人接到的信预测正确,如此直到名单上剩下五百人,其中会有两百人受骗上当,因此骗子只要花几千美元的邮资,便可赚进数百万美元。

这个就是“幸存者偏差”,只要信息不流通,那么“死人是不会说话的“,其他人就不知道这个骗子是有多么的(不)准。

时间: 2024-10-12 10:46:14

从新手运气到幸存者偏差的相关文章

幸存者偏差Survivorship Bias

"最不符合逻辑的地方,一定埋藏着最深刻的逻辑."--余秋雨<行者无疆> 为什么要说幸存者偏差? 因为2018年全国II卷的描述即为典型的"幸存者偏差",且这一例子被引入维基百科.这是一个常见的认知偏差. 幸存者偏差简介 先来段维基百科的解释: 幸存者偏差(英语:survivorship bias),另译为"生存者偏差",是一种认知偏差.其逻辑谬误表现为过分关注于目前人或物"幸存了某些经历"然而往往忽略了不在视界内或

创新工场投资经理:创业就是九死一生

写在前面的话 成功的创业者总是喜欢到处分享经验,创业失败的人却躲得远远的不敢让人知道,久而久之容易让大家犯了"幸存者偏差",可实际上失败的公司多如过江之鲫!就像电影<死神来了>,一直都在逃离死神的追随.关于初始,我们是懵懂的:关于过程,我们是关心的:关于结果,恰恰是我们所最为顾虑的. 本来创业是一个很简单的选择题,很容易选出正确的答案,但后来发现真的很多人会选择错,才知道原来大部分人连创业的基本观念都没有,也就是说不懂江湖没有经验只有一腔热血,血仍未冷但事已败. 其中很大原

普通人能不能炒股

关于这个问题,首先我极其肯定的告诉你能,而且是任何人都可以用适合自己的方式在各种投资领域获得可观的收益.对,你们都没有看错,我说的是任何人,everybody,everyone!!!请无视那些所谓的7,2,1定律,那是失败者的借口,是看不懂投资市场的人的无聊抱怨. 这里为了说明我说的是对的,也为了证明我的结论,同时告诉大家应该怎么去做,我需要讲三个故事,这本来是想要留作我最长的那个关于股票市场的答案的结语,在这里先写出来,最后会整理会那个答案当中. 投资能不能致富,当然是能,为什么有那么多人失败

住在1000万的房子里,过着月薪3000的生活!

消费降级 在一二线城市的你,是否发现周边有这样的群体: 经常在吃饭前会浏览下美团,寻找团购优惠: 看场电影要提前网上购票,因为更便宜啊: 喝杯星巴克咖啡,还想着信用卡积分免费兑换: 即使花几十块钱洗个车,还惦记着哪个渠道有优惠呢-- 其实他们收入尚可,多个百儿八十块的也掏得起,住在价值数百万.甚至上千万的房子里,可就是要省钱. 如果把视角放大拉远,你会有一个奇特的发现:"拼得多.省的多"的团购平台--拼多多,用了3年时间,用户规模达到了3亿之多,将一众电商甩在身后.此外,二手交易平台-

解析《中国互联网软件测试行业2018年度调研报告》

之前收到了一份TesterHome的调查问卷邀请:2018年度中国测试行业问卷调研.最近问卷的汇总结果出来了,有2000+的测试童鞋参与了问卷调查. 从幸存者偏差角度来说,无论是覆盖率还是准确性,结果都有待商榷.不过也能从一定程度上给予参考. 这里我会挑几个测试同学们感兴趣的部分,说说我的看法,请大家理性看待... 传送门:中国互联网软件测试行业2018年度调研报告 一.测试人员年龄分布 从年龄的分布区间来看,目前测试行业的主力军还是26~30岁的同学.中国互联网行业软件测试岗位大概起始于04年

量化交易入门

量化交易,指的是利用数学模型,在金融市场中寻找稳定超额收益的投资手段.量化交易有着挖掘信息能力强,不易受主观情绪影响,下单及时.准确,风险控制严格等特点,能够获得稳健的收益.而其相对于传统主观投资,上手难度也比较大,门槛较高.入门量化交易,主要需要了解如下几方面的知识. 1.数学/统计学知识 既然说到用数学模型,那数学和统计学的知识是必不可少的.由于国内金融市场尚不完备,一些衍生品交易受到限制,所以相较国外市场,能用到的数学/统计学知识也要少一些.对于非理工背景的投资者,需要补充基础的高等数学,

量化交易投资入门

量化交易,指的是利用数学模型,在金融市场中寻找稳定超额收益的投资手段.量化交易有着挖掘信息能力强,不易受主观情绪影响,下单及时.准确,风险控制严格等特点,能够获得稳健的收益.而其相对于传统主观投资,上手难度也比较大,门槛较高.入门量化交易,主要需要了解如下几方面的知识. 1.数学/统计学知识 既然说到用数学模型,那数学和统计学的知识是必不可少的.由于国内金融市场尚不完备,一些衍生品交易受到限制,所以相较国外市场,能用到的数学/统计学知识也要少一些.对于非理工背景的投资者,需要补充基础的高等数学,

职场发展之跟对老板有多重要

我们经常会惊叹同一批进公司,但是进入不同小组的人,为什么个人发展差距越来越大?有的人可谓是平步青云,笑傲群英.有的却是原地踏步,裹足不前.这其中一个很重要的原因是进了好的项目组,跟对了好的老板. 诚然个人发展要突破主要还是内因其决定因素,但是外在的因素也的确缺一不可.尤其跟对老板这个环节可谓是重中之重,绝对的必要条件.所以初入职场的新人,甚至工作三五年的老鸟在遇到没有让你成长甚至阻碍你发展的老板,要坚定果决地离开,尽可能找到下一家再走.如果市面上行情不好,那么就要在工作之余多充电,多学习新的技能

再聪明,你也会常犯的数据分析错误 &nbsp;

如果你不了解大数据,你就不会明白大数据的核心价值有多大.当然你不光要了解大数据,还要学会科学的数据分析方法,才能让大数据产生价值.而在数据分析过程中,聪明的数据分析师也会常犯些错误,纽带线CRM小编跟大家分享这些常犯的错误,在以后应用过程中尽量避免. 错把相关性当成因果性  correlation vs. causation 经典的冰淇凌销量和游泳溺水人数成正比的数据,这并不能说明冰淇凌销量的增加会导致更多的人溺水,而只能说明二者相关,比如因为天热所以二者数量都增加了.这个例子比较明显,说起来可