Google云平台对于2014世界杯半决赛的预测,德国阿根廷胜!

由于本人是个足球迷,前段日子Google利用自己云平台预测世界杯八进四的比赛并取得了75%的正确率的事情让我振动不小。虽然这些年一直听说大数据的预测和看趋势能力如何如何强大,但这次的感受更加震撼,因为世界杯是很多人都在关注并尝试去预测的比赛,Google云平台在这个时候站出来预测比赛无疑很让人充满期待。

当然有件事情必须要讲的是,世界杯从来都是冷门出现在小组赛最多,而进入淘汰赛之后就越来越少,所以Google在八进四才开始预测无疑是件很讨巧的做法。不过不管怎么说,靠大数据预测小概率事件本来就非常难,能预测对大多数非冷门已经非常不容易了。

还有一会巴西对德国的比赛才开始,所以刚刚抓紧时间看了一个Google Cloud Platform的博客发现了他们最新的文章,解释了德法大战没有预测准确的原因,顺便给出了半决赛的预测,会不会准呢,很快就知道了!

我翻译了部分文字,内容如下:

=====================华丽丽的分割线===============================

Google对于八进四的预测结果,只有法国对德国的比赛预测错误。

  • Brazil vs. Colombia: Brazil (71%)
  • France vs. Germany: France (69%)
  • Netherlands vs. Costa Rica: Netherlands (68%)
  • Argentina vs. Belgium: Argentina (81%)

 

Why did we get Germany - France wrong?

为啥德法大战的预测错了?

World Cup teams are especially difficult to model because they play so few games together. USA coach Jurgen Klinsmann recently told the New York Times that he sees his players about as often as he sees his barber. If data is the lifeblood of a good model, we suffered for want of more information.

预测世界杯的球队表现时,建模是很难的因为他们之前在一起比赛的机会是很少的。美国队的教练克林斯曼对纽约时报说他见他的球员们的次数不比他见理发师的次数多。对于好的建模来说,数据是至关重要的,我们总是苦于得不到足够的信息。

But, we know that in the same environment, others fared better in their predictions (h/t Cortana; their model relies more on what betting markets are saying, whereas ours is an inductive model derived from game-play data).

但是我们也知道在同样的情况下,还是有很多其它的预测比我们做的要好(比如h/t Cortana 网址是http://mashable.com/2014/07/02/cortana-world-cup/),他们的建模更多的是依赖于赌球市场给出的赔率,而我们的更多的是基于比赛的数据。

So, why did we get Germany - France wrong? In the first four games of the World Cup, France took more shots than Germany, had more shots on target, and their shots were from a more “dangerous location” (that is, closer to the goal). This information complements actual goals to form an ‘expected goals’ statistic in our model.

那么,为什么对德国和法国的比赛的预测错了呢?那是因为在之前的四场比赛中(3场小组赛+16进8一场),法国队比德国队有更多的射门次数,射正球门(所谓射正球门是指打在门框范围以内的射门)的次数也更多,而且他们的射门来自更有威胁的区域(所谓有威胁区域是指离球门更近的地方)。我们将这些信息在与实际进球数据相配合之后,在我们的模型中得出了“预期进球”这项统计值。

Moreover, in the first four games, Germany allowed their opponents to take more dangerous shots, and thus the expected goal statistic was higher for their opponents. And, it allowed their opponents to pass better in their third of the field. In the Germany-France game, France actually outshot Germany with 13 shots vs. 8 for Germany, and 9 vs. 6 on-target. With a little more luck on their side, they may have pulled ahead.

另外,在前四场比赛中,德国队让对手们拿到了更多的有威胁射门,这导致德国队的“预期进球”数值低于它的对手们。另外,德国队让它的对手们在自己的三分之一场地内得到了更好的传球机会(也就是说放手不够严密)。在德国对法国的那场比赛里,法国队其实有13脚射门,而德国队有8脚,而打在门框内的次数是法国队9次,德国队6次。如果不是德国队的运气更好一些,法国队也许早就领先了。

What about the semi-finals?

那么,半决赛的预测呢?
Here’s our predictions for the next round:
预测如下

  • Brazil vs. Germany: Germany (59%)
  • 巴西 vs 德国: 德国胜率59%
  • Netherlands vs. Argentina: Argentina (61%)
  • 荷兰 vs 阿根廷: 阿根廷胜率 61%

Google云平台对于2014世界杯半决赛的预测,德国阿根廷胜!,布布扣,bubuko.com

时间: 2024-10-08 17:53:43

Google云平台对于2014世界杯半决赛的预测,德国阿根廷胜!的相关文章

Google云平台使用方法 | Hail | GWAS

参考: Hail Hail - Tutorial  windows也可以安装:Spark在Windows下的环境搭建 spark-2.2.0-bin-hadoop2.7 - Hail依赖的平台,并行处理 google cloud platform - 云平台 Broad's data cluster set-up tool 对Google cloud SDK的一个简单的wrap,方便操作. cloudtools is a small collection of command line tool

Google云平台技术架构

Google Cloud  设计原理: 1.分布式文件系统: Google Distributed File System(GSF) 为了满足Google迅速增长的数据处理需求,我们设计并实现了Google文件系统(Google File System – GFS).GFS与传统的分布式文件系统有着很多相同的设计目标,比如,性能.可伸缩性.可靠性以及可用性.但是,我们的设计还基于我们对我们自己的应用 的负载情况和技术环境的观察的影响,不管现在还是将来,GFS和早期文件系统的假设都有明显的不同.所

Google云平台使用方法

参考: Hail Hail - Tutorial spark-2.2.0-bin-hadoop2.7 google cloud platform Broad'sdataclusterset-up tool Genome-wide gene-environment analyses of depression and reported lifetime traumatic experiences in UK BiobankGenome-wide association analyses ident

容器云平台和Kubernetes之间不得不说的那些事

前言我们知道,传统的应用部署方式是将应用直接部署于单独的物理机或虚拟机中.但是在企业数字化转型的浪潮下,如何满足日益丰满的业务需求,如何高效践行敏捷研发,如何更好的将应用落地实施于客户现场,保障稳定高可用并利于维护,是传统企业不得不面对并解决的问题. 用友云技术中台为助力企业数字化转型提供了大量利器,比如本文将着重提及的容器云平台,就是其中之一. 容器云平台,是基于容器的运行时引擎,利用Kubernetes等容器调度方案,用以解决开发.测试.运行环境统一,服务快速部署,运行期服务管理.调度等问题

在云平台上基于Go语言+Google图表API提供二维码生成应用

二维码能够说已经深深的融入了我们的生活其中.到处可见它的身影:但通常我们都是去扫二维码, 曾经我们分享给朋友一个网址直接把Url发过去,如今我们能够把自己的信息生成二维码再分享给他人. 这里就分享一下基于Go语言+Google图表API提供二维码生成功能的小应用,并演示怎样把它公布到云平台上, 让每一个人都能够通过网络訪问使用它. Google图表API Google在http://chart.apis.google.com 上提供了一个将表单数据自己主动转换为图表的服务. 只是,该服务非常难交

漫谈构建运维平台化2014运维线下沙龙(北京站) | 峰云就她了

漫谈构建运维平台化2014运维线下沙龙(北京站) | 峰云就她了

【云计算】Docker云平台—Docker进阶

Docker云平台系列共三讲,此为第二讲:Docker进阶 参考资料: 五个Docker监控工具的对比:http://www.open-open.com/lib/view/open1433897177879.html Docker编排工具简介:http://www.aixchina.net/home/space.php?uid=59140&do=blog&id=135681 集成部署攻略:http://jingyan.baidu.com/article/425e69e6df76bbbe15

【转载】基于Docker的CaaS容器云平台架构设计及市场分析

[转自]http://www.cnblogs.com/darkprince/p/5115739.html 基于Docker的CaaS容器云平台架构设计及市场分析 ---转载请注明出处,多谢!--- 1 项目背景---概述: “在移动互联网时代,企业需要寻找新的软件交付流程和IT架构,从而实现架构平台化,交付持续化,业务服务化. 容器将成为新一代应用的标准交付件,容器云将帮助企业用户构建研发流程和云平台基础设施.缩短应用向云端交付的周期,降低运营门槛.加速企业向互联网技术和业务的双转型. 容器云将

我的postfix过滤邮件、群发邮件问题 跟某云平台的故事

很多企业使用的是自建服务器,我公司自建... 配置文档也是但是百度上,google上的搭建很多时候只有搭建.企业的垃圾邮件 和 病毒邮件 确实又是另外一个课题. 本周要迁移邮箱服务器,原因:我使用的云平台(旧平台云主机快到期,提供商建议我使用新平台(给我打点待代金卷.其实我也有把POSTFIX本地用户,升级到虚拟用户.对于他的新旧平台我还是不太关心,稳定就好,对于功能我也没用得上,但送钱我还是乐意的...对比一下新旧平台还是漂亮了很多. 旧平台: 新平台: postfix基本配置我就不写 .说一