支撑统计学的七大支柱!

支撑统计学的七大支柱!

JSM上统计界的老帮主Stephen Stigler做了一个主题演讲,讲“统计学的七大支柱”,好心又认真的Rick Wicklin同学记了笔记,彼时估计还在中国城吃饭的我才得以了解SS大人到底讲了什么。回头看看笔记,我觉得SS大人有点吹嘘统计学之嫌。所谓支柱,就是没了它咱就垮了。七大支柱为:

汇总:我们从数据汇总中获得知识。本小子认为汇总是统计的经典用途,但汇总(描述统计)只是统计学的一方面,另一个同样重要也相对更靠谱一些的方面是预测。我从来都是扬预测而抑汇总的,因为统计学生来就带有不靠谱的本性,汇总搞错了无从查证,预测错了一定程度上我们还是知道错了多远的。

边际效应递减:随着数据量增大,信息量并不是线性增加,而是到了一定程度之后可能就没太多新的信息了。SS大人用n(样本量)的平方根来形容这个递减,我觉得太牵强了,例如样本均值的标准误里有个n的平方根,但这跟信息有毛线关系呢?

似然/概率:概率论当然是统计学的支柱,当然也要取决于我们怎么定义统计学,但说概率是数理统计的基础肯定不会有人不同意。有人说统计是“研究不确定性的科学”,我现在最烦的就是“科学”二字,人人都把自己的工作升级为科学,尼玛什么是科学?我认为数学/数理统计可以是学科,但不是科学。要称自己的做的是科学,先问问那些养兔子和大肠杆菌的苦逼博士们再想想自己做的算不算科学。说自己研究的是一门学科又没什么丢人的,这年头神马“数据科学”,以及孟生旺老师讽刺的“数学科学学院”(一个名字里三个重复的字,直接叫“数学系”丢人吗?),都是一些没有底气的人才想出来的名词。我敬佩老老实实做实验的自然科学工作者,不是说用纸笔推公式的工作者做的是无意义的事情或者不苦逼,而是说没事不要在这些称谓上较劲,安分守己一点比较好。

横向比较:例如比较两样本均值的差异。SS大人讲别的学科是与“金标准”进行比较,而我们是在数据内部比较,如方差分析ANOVA和t检验。我没太明白这算什么支柱,而且统计里面也不是没有和“金标准”比较的情形啊。

回归和多元分析:身高的回归是经典例子了,这确实是一个有趣的发现,但现实中回归被用来做什么了呢?我感觉回归的主要作用是被铺天盖地的论文拿来当炮灰(你看,俺的方法比回归好),或者在外专业里面当万精油(你看,俺跑了个回归,系数显著耶)。与其说某种方法是支柱,不如说方法和领域知识的结合是支柱。没有具体的领域知识,跑个系数显著的回归只是盲人摸象。

试验设计:这个当然也很重要,我觉得这是七大支柱里唯一可以称为支柱的一个,因为它可以脱离领域知识而有效。没有比较就没有鉴别,大家都知道要比较,但怎么比是个关键问题。例如前些日子火爆的汉字听写大赛就违反了“随机”、“重复”、“对照”等试验设计基本原则,在缺乏概率指导下的竞赛,难免有些不公平。

模型和残差:这个有点局限于回归套路了,不是所有模型都涉及残差项的。若不检查残差的分布,统计学会不会垮掉?我认为未必。即使残差仍然有明显的特征,模型也未必完全不合适,这要看你想要获取模型中哪部分的信息。

摘自谢益辉《统计学的七大支柱》

文章出处:http://www.36dsj.com/archives/26528

时间: 2024-08-06 05:21:43

支撑统计学的七大支柱!的相关文章

经济学人20190323

英文原文 Leaders The new scramble for Africa This time, the winners could be Africans themselves The first great surge of foreign interest in Africa, dubbed the "scramble", was when 19th-century European colonists carved up the continent and seized

01 Shell脚本编程入门知识

Linux Shell语言使用背景  目前全球正处于“互联网+”的时代,各行各业都与互联网挂钩,比如互联网+教育.互联网+销售等等.几乎所有的商品.服务网上都能找得到,而支撑互联网的幕后支柱就是Linux系统.Linux运维技术成为IT技术人员的必备技能.  想要降低Linux运维成本就要进行运维自动化,进行自动化就需要脚本语言.时下Linux系统最流行的脚本语言就是Shell和Python.Python的流行时间短,学习成本高.而Shell几乎是所有运维公司都必须使用的自动化语言,在很多工作环

致敬青春-曾经的恋人

十一本是一个欢度的假期,而对于我却截然相反. 别人在和家人团聚,恋人游玩的时候,我却坚守在岗位上,马不停蹄的coding.....这一切看似很平淡,我也觉得没有什么,然而却被一条朋友圈状态划破了天际,我相信很多人第一想到的可能是“国庆大阅兵”,“朋友游玩的景观”..... 不,不是,都不是,是前女友的一条朋友圈状态,是两个人在阳光下比心的投影照片,还配了一段文字“给大家比个大苹果”(哈哈,是不是看到这样发状态的人就知道是一个活泼可爱的小天使,是的,没错,前女友就是一个这样的人,一提起还会感到自豪

读《赤裸裸的统计学》有感

新买了一本<赤裸裸的统计学>,原本是有感于工作中经常遇到一些数字,有时不知道怎样对待这些数字,于是买了一本通俗的读本看一下. 翻了大半,有了一些感悟.其实这本书就是属于那类“畅销书”,也就是理论不强,故事性强地提到统计学的一些基本知识和现实中的案例.大部分知识其实大学中的统计学课程里都学到了. 读这本书的感悟其实是应该说是关于数学的,大学里学到的数学工作后其实很少使用.以前做音视频算法的时候,用到了一些微积分,现在需要用到统计学的知识.怎么对待数学,数学就是一个工具,你需要用它,他能给你十分强

统计学的领域

统计学的领域 作者注:本文是为中国人民大学统计学院本科院刊所写的稿件.走过了四年本科,觉得应该对后来人讲一些负责任的话,以使大家能更高效地学习.我认为人生的奋斗,怕的不是没有动力,而是有动力却不知道方向.因此,我把我所了解的统计学的领域介绍给大家,让大家早日了解一下统计学的基本内容,早日找到自己的方向.当然,仅仅四年的学习,得出的观点或多或少会浅薄,所以也请各位大师多多指点批评. 如果学了几年统计,还连统计的那个经典定义都背不出就不应该了,在此我不再啰嗦一遍.统计学也不是什么神秘的学科,它的目的

张沐水:2016年内容营销的七大趋势,你知道吗?

内容营销以图片.文字.动画等介质传达有关企业或产品的相关内容来吸引用户关注,给用户以信心,从而达到促进销售的一种营销方式.内容营销是源自分享,协助,给与客户答案的角度来向消费者传递信息,传统的营销方式更多的是通过打断用户思考,视觉,听觉来硬性传递产品信息. 内容营销几乎像是广告的革命者,并不追求短期或立即性的不理性的直接的行为改变,而是理性的.倾向长期的那些内容教育,最后,内容营销可帮助企业达到“思想领导”的角色,扎实的提高品牌的忠诚度.黏度.因此,企业在实践内容营销的时候如果抱着太急功近利的想

项目群管理到底管什么?之七大原则

项目群管理到底管什么?之七大原则|项目群管理转自项目管理者联盟 项目群管理的全景图项目管理者联盟 那项目群管理到底管什么?接下来我们一起看下面这张图.这张图其实是来源于英国的一个管理方法论,我们把它称之为成功的项目群管理,它的英文名字叫做MSP.那MSP的这种管理模式,MSP是一个英文的缩写,它的全称叫做ManagingSuccessful Programs,翻译过来叫做成功的项目群管理.项目管理者联盟 service.mypm.net 那MSP的核心内容,我们可以分成三大块,项目群管理的结构是

房地产仍是经济支柱行业 80%中小房企面临合并

房地产仍是经济支柱行业 80%中小房企面临合并 行业动态成都商报[微博]陈松 柯娟 陈佳曜2014-11-04 07:07 我要分享 0 [摘要]在未来20年里,中国的房地产企业数量将大大减少,并呈现出强者越强的特点,大约70-80%的中小房地产企业将面临着被兼并.合并的风险. 房地产行业最黄金的岁月,已经“如春雷一般过去了”! <成都商报>连续推出“我看未来20年”大型公益演讲的巨大影响持续扩散.继昨成都商报向汽车行业大胆发问“未来20年,你最看好哪家企业”之后,今天,我们将目光聚焦在房地产

如何搭建出类似央视C-Box的电视直播应用的后台管理支撑系统

看网络电视直播已经逐渐替代了有线电视观看的传统方式,而是采用互联网电视IPTV/OTT-TV的方式,通过网络来观看电视频道节目. 这对于入户家庭可以说是一场观看电视方式的变革. 随着电视观看方式的变革,运营商们也在迎合互联网电视的风潮开始走OTT网络电视的运营道路,不过目前广电总局的政策是只有牌照方的电视媒体公司才可以运营. 目前七大牌照方为: 央视国际-CNTV(中央电视台为申请主体) 杭州华数(浙江.杭州电视台联合申请) 上海文广-百视通(上海电视台为申请主体) 南方传媒(广东电视台为申请主