×××世界杯,“痛恨”大数据?

作者 | 张戈 (公众号ID:TechECR)

昨夜,阿根廷不相信眼泪,但也没相信梅西。蓝白军团0:3输给了格子军团,比德国还没有尊严,估计一群人已上了天台。

首先声明,世界杯期间我没有参与×××,也从未站上天台。不是不想一试手气,只是没这个底气。由此我开始“痛恨”那些大数据企业,平日总是宣传自己技术能力如何强大,但关键时刻,在我期盼天上掉馅饼的时候,在我无限接近财务自由的时候,他们为什么集体“失声哑火”,没有进行任何靠谱的预测呢?

白岩松说的一点都不对

“世界杯,中国除了足球队没去,其他都去了。” 我看白岩松说的一点都不对,至少中国一家大数据企业也没有去。首轮,德国对阵墨西哥,威廉·希尔开出的胜平负赔率分别为:1.44、 4.50、7.00。如果大数据企业技术靠谱,重注投向墨西哥,恐怕一场球90分钟,就会搞定一年的企业利润,中国也将会出现首家盈利上市的大数据企业。

言归正传,我虽不是内行,但也不能光说些外行话。大数据不是万能的,至少现在不是万能的。理论上,拥有全部数据就能预测所有的未来。但这只是理想理论,因为我们不可能拥有全部数据,或者说,拥有了世界上全部的数据,将是极其可怕的事情,如何一切均可预测,生活还有什么意义。

“科学预测”是个伪命题

回到世界杯的话题,即使排除×××做球的阴谋论影响,我们也不可能拿到所有相关数据。此前,英国媒体《电讯报》就不信邪,综合多维度数据给出了一套所谓“科学预测”方法论。《电讯报》针对世界排名、预选赛表现、历史成绩、阵容年龄、球员国际比赛经验、球员所效力俱乐部、主教练经验、球队和教练的磨合等,8类数据维度进行预测,其结论依旧是:天注定。

举例说明,从1950年到2014年的世界杯,只有巴西队在1962年,以世界排名第一的身份夺冠。17届世界杯中,世界排名第二的球队夺冠次数最多,高达6次。此外,世界排名第四的球队夺冠4次,世界排名第三的球队夺冠有1次。以此推断,巴西、比利时、葡萄牙将成为本届世界杯的夺冠热门,而世界第一的德国队应该小心为上。

另一数据维度。目前为止,所有世界杯冠军球队夺冠的平均年龄为26.4岁,本次英格兰队的年龄结构最接近“冠军水准”,平均年龄26.1岁。

由此可见,不同维度的数据分析,产生不尽相同的结果,而综合上述数据的分析结果依然是:天注定。

Y等于几?

回到专业话题。其实,大数据的专业能力体现在数据算法建模,而基础能力则是海量多维度的数据采集。而所谓数据算法,可以简单粗暴的理解为多元一次方程式:X1Y1+X2Y2+X3Y3……XnYn=A。其中,X代表权重比例,Y代表不同维度的数据。

《电讯报》以8个维度进行分析,即Y8。事实上,数据维度肯定不只Y8,例如比赛当时2个小时内的天气数据,草坪长短数据、草皮湿滑程度数据,甚至运动员情绪数据。如果上述数据很难取得,也就很难预测比赛结果。所以与其相信大数据能预测世界杯,还不如相信章鱼“保罗”、神猫“阿基利斯”。

不能仅看见水晶球

这正是大数据产业所面临的困境之一。大数据不是万能的,甚至大数据能体现的效果,也是未知数。如果可以拍胸脯说,一定会产生效果。大数据公司的盈利模式就肯定不是现在这种苦哈哈的项目服务制。其完全可以按利润分成方式,与用户共建系统。举例说明,与银行共建贷款大数据体系,在长尾的客户群体中,筛选出潜在贷款客户,即使成功率只是提升1%,银行与大数据企业的收入也会明显增加。当然,如果银行此类重资本高门槛的市场很难进入,大数据企业也完全可以自己组建一家轻资本的P2P金融机构。而事实上,类似的模式案例,现在好像还未出现。

为什么?还是回答世界杯的话题,很难同时获取高价值、高品质、多维度的数据。大数据平台建设、数据算法建模可称为大数据的“水晶球”,但支撑“水晶球”魔力展现的是数据。数据始终是制约大数据发展的关键因素,因为企业业务流程再造,即业务流程数据化远远没有完成,不同标签的数据治理也依然任重道远。此外,多维度的数据融合,也还是远远没有实现。

巧妇难为无米之炊,证券行业希望通过梳理所有数据关联,严查关联交易,但上市公司高管同样可以怂恿“舅舅”这样的外戚开设账户,提前透露消息,并从中牟利。原因即在于,原始的户籍数据一时难以进行对接。

不必唱衰大数据产业

当然,我们并不是在唱衰大数据产业,即使数据支撑力度有限,大数据也还有其发挥价值的空间。首先,业务流程数据化、数据治理、数据融合等基础工作,也应归属于大数据的业务范畴,毕竟数据才是革命的资本。

同时,在不同行业领域,也已经展现出不同的大数据强应用场景。在政务领域,至少可以大数据为抓手,促进数据治理、数据融合;在金融领域,大数据已经在客户画像分析、金融风险控制等领域得到广泛应用;在制造领域,大数据正在用于设备的运行状态监控,判断是否需要更换零件。此外,公安、医疗等自身原始数据积累较好的领域,更将成为大数据的强应用场景。

最后说一句,我们不能因为大数据不能预测世界杯,就痛恨贬低大数据。当然,也不能以最理想化的数据接入状态,去忽悠用户,夸大大数据的价值。或许大数据技术已经成熟,但大数据的基础工作才刚刚起步。

当然,如问我距离理想状态还有多远?

或许就在中国下次入围入世界杯之时。

- END -

作者简介:TechECR,关注科技企业生态体系建设,这里有思考、有观点;有点头咂嘴,也有会心一笑。创始人:张戈,曾任《商业伙伴》、《电脑商报》副总编,不码字,不写稿子、只输出有质感的文章。以生态合作为视角,研究IT产业18年,常年保持对ICT企业、IT方案商、IT渠道商保持高频度采访。合作联系:[email protected]

关于

原文地址:http://blog.51cto.com/13642073/2131624

时间: 2024-10-11 13:24:48

×××世界杯,“痛恨”大数据?的相关文章

操盘手英超大数据观察:13/14赛季平局仅20.5%

时下大数据是一个时髦的词汇,前几天在朋友圈里看到一篇<某电商文胸数据:A少了C多了>,文中有数据显示,某省已经摆脱了胸部最小的省份等等.这篇东西对普通人来说可以当作花边了解一下,增加点茶余饭后的谈资,对商家来说则是制定商业计划的风向标. 经历了2014巴西世界杯,大数据在博彩中的运用也越来越受到重视.上周末新赛季的英超(微博 专题) 联赛已经揭幕,10场比赛主队仅有阿森纳(官方微博 官网 数据 )和利物浦(官方微博 数据) 两强收获3分,8支客队保持不败(2平6胜),多少让人感觉一丝冷意,尤其

大数据与JS实现2014巴西世界杯冠军预测图

代码下载地址:http://www.zuidaima.com/share/1855841547176960.htm 原文:大数据与JS实现2014巴西世界杯冠军预测图 四年一度的球迷狂欢节就要到了,32强已经准备就绪,6月13日开始将为全世界的球迷带来顶级的足坛盛宴. 自32强分组以来,关于各支球队胜负的预测从未停止过.就连<时间简史>的作者.世界著名物理学家霍金都通过科学公式预测出英格兰队要想在2014世界杯上夺冠需要具备的要素. 开发者Andrew Yuan利用大数据和前端技术制作了一个预

蔡先生论道大数据之十四:案例分析(2) 国足也可以进世界杯

巴西世界杯,德国队夺冠,首推主教练勒夫功不可没,还有场上所有队员的精彩表现,相信大家都没二话,我今天就说一说德国队背后的另一个功臣"Match In-sights". 哈,"Match In-sights"可不是一个人的名称,是SAP为德国队量身定制的一款基于大数据的足球解决方案的电脑系统,堪称德国队的第12人.这一套系统可以迅速收集,处理分析球员和球队的技术数据,使用"数据和事实"来优化球队配置,从而提升球队作战能力,并通过分析对手技术数据,找

从大数据看2018世界杯 —冷门迭爆,你热爱的球队回家了吗?

2018年俄罗斯世界杯作为四年一度的足球盛宴,不管是不是球迷,在这个夏天都将点燃无数人的体育竞技热情.但本届世界杯爆冷不断,一首"凉凉"刚送给了输给韩国队的日耳曼战车,大热夺冠种子队阿根廷与葡萄牙就在同一天一起再见了本届世界杯,众多球迷期待的两位足球先生梅西和C罗的相遇之战未能如愿,紧接着西班牙爆冷点球大战输给俄罗斯,巴西负给比利时--.虽冷门迭爆,但不得不说,一切皆是未知,这就是世界杯的魅力! 在此带大家从MobData大数据中解读世界杯的另一面魅力所在. 世界杯上总是不乏一球成名的

身边的大数据和我们的着手点

2014年8月17日- 从上次在图书馆外等小孩借书开始考虑这个问题,已经有好几个月了.一直在思考,也动手做了一些尝试,但是一直“在过程中”.期间,再次翻阅了<大数据时代>和相关的网上资源,每天除了工作,总在思考将这段的思路总结一下. 早期的精确统计,或随机取样,到现在的“样本=全部”的大数据思想出现,我感觉我们可以做点事情了.虽然一直忙碌于“企业应用”的事情,不过总有一份“互联网的基因”存在.从最早采集的50多POI,到最近收集的300多移动上网过程数据,做一个数据分析,做一下大数据时代的尝试

世界杯中的大数据之道

让世界球迷翘首以盼的世界杯,在热情的桑巴舞和全世界球迷的欢呼中如期而至.在此期间,无论是资深球迷还是伪球迷,甚至是压根不看球的普通人,对于世界杯,都必然提及一二,这俨然成为了世界的节日,一个万众期待的狂欢party.随着移动互联的高度普及和发展,“社交足球”似乎踢得比世界杯还火热,各种渠道,各种工具,让世界杯也不可避免的跨入了“大数据时代”. 数据与世界杯的关系,除了球员的射门次数.传球次数.球队全场控球率等技术统计,还能怎样体现呢?用数据来展示球队,回顾比赛历史,区别球员表现已习以为常,但这些

推荐文章:机器学习:“一文读懂机器学习,大数据/自然语言处理/算法全有了

PS:文章主要转载自CSDN大神"黑夜路人"的文章:          http://blog.csdn.NET/heiyeshuwu/article/details/43483655      本文主要对机器学习进行科普,包括机器学习的定义.范围.方法,包括机器学习的研究领域:模式识别.计算机视觉.语音识别.自然语言处理.统计学习和数据挖掘.这是一篇非常好的文章,尤其感学原文作者~          http://www.thebigdata.cn/JieJueFangAn/1308

一文读懂机器学习,大数据/自然语言处理/算法全有了……

原文地址 http://www.open-open.com/lib/view/open1420615208000.html http://www.cnblogs.com/subconscious/p/4107357.html 引论 在本篇文章中,我将对机器学习做个概要的介绍.本文的目的是能让即便全然不了解机器学习的人也能了解机器学习.而且上手相关的实践.这篇文档也算是 EasyPR开发的番外篇.从这里開始.必须对机器学习了解才干进一步介绍EasyPR的内核.当然,本文也面对一般读者.不会对阅读有

品牌营销进化三大方向:场景爆破、移动互联与大数据整合

一个品牌在媒体众多.消费者被高度分散的时代,应该如何做,才能让消费者对你印象深刻,并且不断累积品牌资产?如何通过广告和营销引发消费行动?在扑面而来的移动互联网时代,品牌的传播模式正在遭受一场前所未有的革命. 这场需要重新定义传播模式的革命,根本原因,在于今天消费者生活形态的几个变化. 第一个变化,来自于消费者随时随地可以享用的移动互联网,注意力被分散,移动终端链接其他终端的需求加强. 第二个变化,消费者快速穿梭于各个场所和空间,生活半径逐步扩大和分散,单一媒体已经很难覆盖你想要的消费者. 第三个