文档章节

大数据可否算准世界杯?

灵玖lingjoin
 灵玖lingjoin
发布于 2014/06/19 16:50
字数 1442
阅读 4
收藏 0
点赞 0
评论 0

  人类一思考,上帝就发笑;世界杯一来到,上帝笑得血压也升高。倒不是足球踢得多欢乐,而是世界杯预测太恶搞。

  我略微总结了下,剔除掉贝利和大校这种声名卓著的反向指标,煞有介事的世界杯预测大致可以分为五类:一是实力决定论,以高盛和德银等投行为代表,将FIFA排名、过往战绩、近期表现、球员身价、赌球赔率、国家经济等一系列数据综合反映出的球队实力作为预测依据,用计量模型计算出看上去精确至极的概率,只不过,计算结果有较大差异,比如,高盛预测巴西夺冠,德银则更看好英格兰。

  二是条件决定论,以霍金教授为代表,将各种客观条件对某一球队的表现影响糅到一个获胜公式里,这些条件包括球场选择、裁判国籍、球衣选择、阵型选择和交通工具选择等,只不过,这种公式的预测有效时段很短,所以在决赛还离得远的现在,公式还预测不出最后的冠军归属。

  三是流言决定论,以雅虎和微软Bing为代表,将以亿为单位的网络噪音转化为清晰的结果信号。虽然这种互联网魔术看上去既科学又玄妙,甚至可以从经济学的“预期自我实现”理论加以解释,但总让人联想到古时候无论中国还是西方,帝王对童谣和吟游诗人作品的格外关注。

  四是宿命归属论,以一则关于1966年和2014年的时空重叠热帖为代表,1966年,欧冠冠军是皇家马德里,西甲冠军是马德里竞技,西乙冠军是拉科鲁尼亚,意甲冠军是尤文图斯,皇家贝蒂斯降级西乙,2014年无一例外都是如此。“Yesterday once more”就剩世界杯了,1966年是英格兰夺冠,按照宿命归属,2014年英格兰也将问鼎。

  五是动物先知论,以章鱼保罗为代表,2008年保罗预测欧洲杯6场5胜,2010年保罗预测南非世界杯8场全胜,只不过,保罗没能活到2014年巴西世界杯揭幕,于是,乌龟、大象、熊猫等动物先知又登上了预测舞台,只不过,保罗的辉煌再难复制。

  当然,所有这些世界杯预测或多或少都有恶搞的成分,当不得真。但稍微严肃一下,细致分析这五种方法论,除了最后一种,剩下四种都用到了大数据,这恰是时下大数据热的一种表现。从世界杯预测看大数据热,三个误区值得警醒。

  首先,大数据并不能解决所有问题。大数据是很有用的,几乎每一个环节,包括产品设计、市场定位、目标选择、销售策略和模式修正,都能靠大数据来解决问题,甚至连各种和商业无关的问题,也都能从大数据这里得到帮助。但大数据并不是万能的,大数据能解决的都是客观问题,而不是主观问题。就拿世界杯预测来说,谁能夺冠取决于多种因素,各种预测方法论本质上并无区别,只不过它们对不同决定要素赋予的权重不尽相同。也就是说,决定夺冠的要素是什么,这是一个主观问题,大数据只能说明客观的状态,无法对夹杂重要主观判断的问题直接给出解答。

  其次,数据并不是越大越好。数据分析早就存在,大数据火爆却是最近的事情,其中的区别就在一个“大”字。从道理上讲,数据种类越多、序列越长,包含的信息就越丰富。但值得强调的是,信息越丰富未必就越好,当下是一个信息大爆炸的时代,信息越多有的时候越不利于获知。而且更重要的是,像世界杯预测,明显是一个核心信息不突出的事情,所以信息之间反而容易形成无逻辑的冲突,这恰是预测方法论众多,谁都不靠谱的原因。此外,数据越大,数据处理过程中的选择就越多,而选择总是难以回避道德风险问题,每一个大数据分析者,都得面对为特定目标而选择的诱惑,“有选择的选择”往往是大数据反而模糊了真相的潜在原因。

  最后,大数据搞不定薛定谔的猫。在盒子打开前,薛定谔的猫既是活的,又是死的,只有打开盒子这一行为,才能导致状态叠加的坍塌,不确定性才会消失。也就是说,在世界杯真正开始前,32支球队都是冠军,又都不是冠军,只有踢起来才能见真章。大数据分析都是基于既成事实的,它更擅长于告诉我们,世界是怎样,而不是世界应是怎样和将会怎样。在不确定性面前,大数据是无力的,所以究其根本,大数据不是用来预测的。大数据能带给我们的,是知识,是获知,而不是判断,更不是武断,而尊重不确定性,才是正确使用知识的一部分。

© 著作权归作者所有

共有 人打赏支持
灵玖lingjoin
粉丝 85
博文 2881
码字总数 4069557
作品 0
东城
2018世界杯冠军竟然被大数据算出来了,有你pick的球队吗?

每届世界杯都会诞生很多新鲜的话题,但万年不变的是对比赛结果的预测。2018年俄罗斯世界杯来了,今年的大力神杯又将花落谁家?想必每个球迷心中都有自己的答案。但是对于那些银行家、投资商们来...

恒泰博远 ⋅ 06/15 ⋅ 0

×××世界杯,“痛恨”大数据?

作者 | 张戈 (公众号ID:TechECR) 昨夜,阿根廷不相信眼泪,但也没相信梅西。蓝白军团0:3输给了格子军团,比德国还没有尊严,估计一群人已上了天台。 首先声明,世界杯期间我没有参与×××...

张戈BP ⋅ 前天 ⋅ 0

世界杯也走向“比拼”大数据的时代

《日本经济新闻》6月19日报道称,俄罗斯足球世界杯已于6月14日揭开战幕。作为第21次举办的足球世界杯,如何活用大数据有可能成为决定各支球队胜负的重要因素。从对阵球队的分析到战术建议,还...

加米谷大数据 ⋅ 前天 ⋅ 0

瑞银预测德国赢,高盛“赌”巴西,谁才是世界杯预测之王?

  人类天生对于未来可能会发生的事一直有很浓厚的兴趣,古代有夜观天象的预言家,当代则有各式各样的预测方式如统计分析、大数据、人工智能,最近全球最火的预测莫过于在俄罗斯开打的 2018...

DeepTech深科技 ⋅ 06/14 ⋅ 0

优酷世界杯高清直播背后,一场技术升级内容产业的浪潮

6月16日凌晨,葡萄牙与西班牙的世界杯大战最终以3:3的总比分精彩收场,将本届世界杯推向了又一个观赛高潮,因为根据优酷“进球就下红包雨”活动规则,仅这一场比赛优酷就连下6场红包雨,有网...

优小酷 ⋅ 06/17 ⋅ 0

在咖啡桌上看世界杯!FB和谷歌刚刚在CVPR联合发布AR看球新方式

     大数据文摘出品   编译:小七、蒋宝尚   世界杯来啦!熬夜看比赛时,有没有那么一瞬间想要飞到俄罗斯在现场欢呼?   一个新的系统或许可以给你观看足球赛事更现场感的体验! ...

大数据文摘 ⋅ 昨天 ⋅ 0

6月15日云栖精选夜读丨史上最大规模世界杯直播 阿里云承包了全网70%的流量

6月14日晚,2018年俄罗斯世界杯在莫斯科开幕。国内数千万的观众通过CCTV5、优酷、央视影音或者是咪咕视频观看了此次开幕赛。值得注意的是,这四大官方指定网络直播平台都选择了使用阿里云的技...

yq传送门 ⋅ 06/15 ⋅ 0

BUF早餐铺 世界杯期间Wi-Fi热点可能带来安全风险;Chrome曝出新高危漏洞,需尽快更新修复;VPNFilter导致更多厂商中招;网售志愿填报卡大...

     高考第二天,早餐丰盛点儿~      各位 Buffer 早上好,今天是 2018 年 6 月 8 日星期五,农历四月廿五。今天的 BUF 早餐内容主要有:世界杯在即,城市 Wi-Fi 热点可能带来安全风...

FreeBuf ⋅ 06/08 ⋅ 0

德国本届世界杯胜算最大?帕绍大学基于ELO评级预测

     大数据文摘出品   编译:halcyon、小鱼   离2018俄罗斯世界杯开幕的日子越来越近,学术界的球迷们也按捺不住期待的心情,纷纷用算法对2018世界杯的比赛结果进行预测。   巧的...

大数据文摘 ⋅ 06/11 ⋅ 0

88年的世界杯历史,用Python带你回顾

6月14日,2018世界杯在俄罗斯正式开幕,自1930年至今,世界杯已经走过了88年历程,除1942年和1946年因二次世界大战的影响没有举行外,四年一度的赛事从未中断,这次就让我们一起来用Python回...

菜鸟学python ⋅ 06/14 ⋅ 0

没有更多内容

加载失败,请刷新页面

加载更多

下一页

Jenkins实践3 之脚本

#!/bin/sh# export PROJ_PATH=项目路径# export TOMCAT_PATH=tomcat路径killTomcat(){pid=`ps -ef | grep tomcat | grep java|awk '{print $2}'`echo "tom...

晨猫 ⋅ 今天 ⋅ 0

Spring Bean的生命周期

前言 Spring Bean 的生命周期在整个 Spring 中占有很重要的位置,掌握这些可以加深对 Spring 的理解。 首先看下生命周期图: 再谈生命周期之前有一点需要先明确: Spring 只帮我们管理单例模...

素雷 ⋅ 今天 ⋅ 0

zblog2.3版本的asp系统是否可以超越卢松松博客的流量[图]

最近访问zblog官网,发现zlbog-asp2.3版本已经进入测试阶段了,虽然正式版还没有发布,想必也不久了。那么作为aps纵横江湖十多年的今天,blog2.2版本应该已经成熟了,为什么还要发布这个2.3...

原创小博客 ⋅ 今天 ⋅ 0

聊聊spring cloud的HystrixCircuitBreakerConfiguration

序 本文主要研究一下spring cloud的HystrixCircuitBreakerConfiguration HystrixCircuitBreakerConfiguration spring-cloud-netflix-core-2.0.0.RELEASE-sources.jar!/org/springframework/......

go4it ⋅ 今天 ⋅ 0

二分查找

二分查找,也称折半查找、二分搜索,是一种在有序数组中查找某一特定元素的搜索算法。搜素过程从数组的中间元素开始,如果中间元素正好是要查找的元素,则搜素过程结束;如果某一特定元素大于...

人觉非常君 ⋅ 今天 ⋅ 0

VS中使用X64汇编

需要注意的是,在X86项目中,可以使用__asm{}来嵌入汇编代码,但是在X64项目中,再也不能使用__asm{}来编写嵌入式汇编程序了,必须使用专门的.asm汇编文件来编写相应的汇编代码,然后在其它地...

simpower ⋅ 今天 ⋅ 0

ThreadPoolExecutor

ThreadPoolExecutor public ThreadPoolExecutor(int corePoolSize, int maximumPoolSize, long keepAliveTime, ......

4rnold ⋅ 昨天 ⋅ 0

Java正无穷大、负无穷大以及NaN

问题来源:用Java代码写了一个计算公式,包含除法和对数和取反,在页面上出现了-infinity,不知道这是什么问题,网上找答案才明白意思是负的无穷大。 思考:为什么会出现这种情况呢?这是哪里...

young_chen ⋅ 昨天 ⋅ 0

前台对中文编码,后台解码

前台:encodeURI(sbzt) 后台:String param = URLDecoder.decode(sbzt,"UTF-8");

west_coast ⋅ 昨天 ⋅ 0

实验楼—MySQL基础课程-挑战3实验报告

按照文档要求创建数据库 sudo sercice mysql startwget http://labfile.oss.aliyuncs.com/courses/9/createdb2.sqlvim /home/shiyanlou/createdb2.sql#查看下数据库代码 代码创建了grade......

zhangjin7 ⋅ 昨天 ⋅ 0

没有更多内容

加载失败,请刷新页面

加载更多

下一页

返回顶部
顶部