作者 | 张戈 (公众号ID:TechECR)
昨夜,阿根廷不相信眼泪,但也没相信梅西。蓝白军团0:3输给了格子军团,比德国还没有尊严,估计一群人已上了天台。
首先声明,世界杯期间我没有参与×××,也从未站上天台。不是不想一试手气,只是没这个底气。由此我开始“痛恨”那些大数据企业,平日总是宣传自己技术能力如何强大,但关键时刻,在我期盼天上掉馅饼的时候,在我无限接近财务自由的时候,他们为什么集体“失声哑火”,没有进行任何靠谱的预测呢?
白岩松说的一点都不对
“世界杯,中国除了足球队没去,其他都去了。” 我看白岩松说的一点都不对,至少中国一家大数据企业也没有去。首轮,德国对阵墨西哥,威廉·希尔开出的胜平负赔率分别为:1.44、 4.50、7.00。如果大数据企业技术靠谱,重注投向墨西哥,恐怕一场球90分钟,就会搞定一年的企业利润,中国也将会出现首家盈利上市的大数据企业。
言归正传,我虽不是内行,但也不能光说些外行话。大数据不是万能的,至少现在不是万能的。理论上,拥有全部数据就能预测所有的未来。但这只是理想理论,因为我们不可能拥有全部数据,或者说,拥有了世界上全部的数据,将是极其可怕的事情,如何一切均可预测,生活还有什么意义。
“科学预测”是个伪命题
回到世界杯的话题,即使排除×××做球的阴谋论影响,我们也不可能拿到所有相关数据。此前,英国媒体《电讯报》就不信邪,综合多维度数据给出了一套所谓“科学预测”方法论。《电讯报》针对世界排名、预选赛表现、历史成绩、阵容年龄、球员国际比赛经验、球员所效力俱乐部、主教练经验、球队和教练的磨合等,8类数据维度进行预测,其结论依旧是:天注定。
举例说明,从1950年到2014年的世界杯,只有巴西队在1962年,以世界排名第一的身份夺冠。17届世界杯中,世界排名第二的球队夺冠次数最多,高达6次。此外,世界排名第四的球队夺冠4次,世界排名第三的球队夺冠有1次。以此推断,巴西、比利时、葡萄牙将成为本届世界杯的夺冠热门,而世界第一的德国队应该小心为上。
另一数据维度。目前为止,所有世界杯冠军球队夺冠的平均年龄为26.4岁,本次英格兰队的年龄结构最接近“冠军水准”,平均年龄26.1岁。
由此可见,不同维度的数据分析,产生不尽相同的结果,而综合上述数据的分析结果依然是:天注定。
Y等于几?
回到专业话题。其实,大数据的专业能力体现在数据算法建模,而基础能力则是海量多维度的数据采集。而所谓数据算法,可以简单粗暴的理解为多元一次方程式:X1Y1+X2Y2+X3Y3……XnYn=A。其中,X代表权重比例,Y代表不同维度的数据。
《电讯报》以8个维度进行分析,即Y8。事实上,数据维度肯定不只Y8,例如比赛当时2个小时内的天气数据,草坪长短数据、草皮湿滑程度数据,甚至运动员情绪数据。如果上述数据很难取得,也就很难预测比赛结果。所以与其相信大数据能预测世界杯,还不如相信章鱼“保罗”、神猫“阿基利斯”。
不能仅看见水晶球
这正是大数据产业所面临的困境之一。大数据不是万能的,甚至大数据能体现的效果,也是未知数。如果可以拍胸脯说,一定会产生效果。大数据公司的盈利模式就肯定不是现在这种苦哈哈的项目服务制。其完全可以按利润分成方式,与用户共建系统。举例说明,与银行共建贷款大数据体系,在长尾的客户群体中,筛选出潜在贷款客户,即使成功率只是提升1%,银行与大数据企业的收入也会明显增加。当然,如果银行此类重资本高门槛的市场很难进入,大数据企业也完全可以自己组建一家轻资本的P2P金融机构。而事实上,类似的模式案例,现在好像还未出现。
为什么?还是回答世界杯的话题,很难同时获取高价值、高品质、多维度的数据。大数据平台建设、数据算法建模可称为大数据的“水晶球”,但支撑“水晶球”魔力展现的是数据。数据始终是制约大数据发展的关键因素,因为企业业务流程再造,即业务流程数据化远远没有完成,不同标签的数据治理也依然任重道远。此外,多维度的数据融合,也还是远远没有实现。
巧妇难为无米之炊,证券行业希望通过梳理所有数据关联,严查关联交易,但上市公司高管同样可以怂恿“舅舅”这样的外戚开设账户,提前透露消息,并从中牟利。原因即在于,原始的户籍数据一时难以进行对接。
不必唱衰大数据产业
当然,我们并不是在唱衰大数据产业,即使数据支撑力度有限,大数据也还有其发挥价值的空间。首先,业务流程数据化、数据治理、数据融合等基础工作,也应归属于大数据的业务范畴,毕竟数据才是革命的资本。
同时,在不同行业领域,也已经展现出不同的大数据强应用场景。在政务领域,至少可以大数据为抓手,促进数据治理、数据融合;在金融领域,大数据已经在客户画像分析、金融风险控制等领域得到广泛应用;在制造领域,大数据正在用于设备的运行状态监控,判断是否需要更换零件。此外,公安、医疗等自身原始数据积累较好的领域,更将成为大数据的强应用场景。
最后说一句,我们不能因为大数据不能预测世界杯,就痛恨贬低大数据。当然,也不能以最理想化的数据接入状态,去忽悠用户,夸大大数据的价值。或许大数据技术已经成熟,但大数据的基础工作才刚刚起步。
当然,如问我距离理想状态还有多远?
或许就在中国下次入围入世界杯之时。
- END -
作者简介:TechECR,关注科技企业生态体系建设,这里有思考、有观点;有点头咂嘴,也有会心一笑。创始人:张戈,曾任《商业伙伴》、《电脑商报》副总编,不码字,不写稿子、只输出有质感的文章。以生态合作为视角,研究IT产业18年,常年保持对ICT企业、IT方案商、IT渠道商保持高频度采访。合作联系:[email protected]
原文地址:http://blog.51cto.com/13642073/2131624