大数据只是可能,而非万能?

巴西世界杯的帷幕已然落下,亿万球迷或喜或悲、或惊愕或迷茫——情绪纷繁复杂却终将平复,生活与工作仍会继续向前。回顾比赛全局,也许有朋友还能记 起,本届世界杯开幕前,雅虎美国的一支团队曾预测说,巴西终将折桂夺冠。而今尘埃落定,显然,事前的预言未能成真。不过,这并不意味着相关团队的研究方法 没有价值。

雅虎的研究小组从轻博客Tumblr浩如烟海的1.889亿个博客账户的831亿篇文章中抽取出与足球相关的内容,再将焦点凝聚在今年2月至5月2730万篇与世界杯相关的粉丝评论,以“为每支队伍赋予优势值”的方式,判断出巴西队的赢面较大。

与我们这个时代最伟大的物理学家霍金教授应用“世界杯夺冠公式”来测算比赛结果不同,雅虎给出的结果由于是基于轻博客粉丝讨论,因而更多地展现了多 数观众的倾向和预期——每位球迷都有心目中的冠军球队,桑巴足球凭借强悍实力和出众的观赏性而深得人心,夺冠呼声极高。巴西队大比分惨败德国后,球迷的悲 痛也是个证明。但比赛结果不取决于亿万观众票选,而是场上十几人的表现。这一点也正如霍金教授所言:相对于量子力学来说,足球要复杂多了。

无论如何,雅虎的预测都是一种非常有益的尝试。在那些粉丝倾向足以决定结果的领域,类似的研究对于企业研究市场和消费者需求会很有帮助。

雅虎对世界杯赛结果的研判还可能引发更多思考:比如近来被炒得有点儿过热的大数据能否预测未来?一些业界同仁和分析家认为数据可以揭示规律,进而帮助人和企业预知结果;另一些研究者则认为大数据的功用有限、迷信大数据是愚蠢的。

作为在此领域有所涉猎的研发人员,我的观点介于两者之间。

    大数据揭示的是关联与现象,而非规律和本质,所谓“知其然而不知其所以然”正是大数据分析结果的写 照。商学院流 传很广的一个案例,卖场数据显示啤酒和纸尿裤的销售相关。经过调查发现,这是年轻父亲被妻子指派采购婴儿用品时夹带啤酒私货的一种趋同倾向。如果仅限于发 现关联,卖场也许会简单地把两种商品摆放在一起;而了解到现象背后的模式,便可以开展更有针对性的促销。

也就是说,大数据能提供宝贵的线索,但不能替代人工研究——比如深入现场去发掘消费行为链背后隐藏的逻辑。有兴趣的读者可以看看《品牌洗脑》一书,作者是资深营销人士,书中列举了很多生动却可能让人惊诧的例子:现代营销是如此无孔不入,比如,人还没出生营销就开始了,孕妇常去的卖场的背景音乐对婴儿有止啼的效果等等。

这些案例经常有研究数据支撑,虽然未必达到大数据的级别,但已经相当精密,包括用核磁共振扫描测试者的大脑。

    对大数据极度乐观或悲观的人,其实都是将大数据视为传统营销模式的延伸。乐观派渴望找到一个“大杀器”,对消费者实现完美的“引诱”和控制。而悲观派则更理性一些——物极必反,过度营销会招致消费者反抗,利用大数据分析结果来强化原本已如水银泻地般无孔不入的营销,这真是好事吗?

在我看来,消费者行为实际上很难预测和控制——据传萨特在战后出版哲学巨著《存在与虚无》,出版商对这部巨著的销量并不看好,权当支持文化事业,但 销售成绩居然大大超出预期。出版商惊讶之余,发现原来战争期间金属被搜刮一空,商贩缺乏秤砣,用各种物品代替,有不知名的商贩发现该书的重量正好是一磅, 于是商贩普遍购来充当秤砣。

在这个故事中,大数据分析就无法准确预测这一应用情境。但我们可以做到,当消费者产生用书来当秤砣这样的奇思妙想,大数据可以马上向他推荐《存在与 虚无》。既然消费者很难预测和控制,不如一方面利用大数据来观察和总结特定情境下的群体行为关联,一方面更谦虚和认真地与消费者个体沟通,用审慎执着的态 度及更好的产品、服务来黏住顾客,而不是只在营销上下功夫。

总而言之,大数据虽然能在很大程度上提高预测的准确性,它也只能让产品和服务本就出色的企业变得更强,却不能拯救那些存在致命缺陷的企业于水火之中

时间: 2024-11-08 07:41:09

大数据只是可能,而非万能?的相关文章

推荐一本大数据的书籍,非技术类

因为关注大数据,也写过若干关于大数据的文章,做过若干关于大数据的演讲,所以对有关这一主题的论文和书籍非常有兴趣.过去几年,在这方面读过十几本书,上百篇论文和文章.相对而言,舍恩伯格的<大数据时代>是迄今为止我读过的最好的一本专著,中英文都算上. 此书的一大贡献是在大数据方兴未艾,众说纷纭的时刻,进一步阐述和厘清了大数据的基本概念和特点,这对许多以为大数据就是数据大的人来说很有帮助. 在人类历史长河中,即使是现代社会日新月异的发展中,人们还主要是依赖抽样数据,局部数据,片面数据,甚至是在无法获得

(转)我所经历的大数据平台发展史(二):非互联网时代 ? 下篇

编者按:本文是松子(李博源)的大数据平台发展史系列文章的第二篇(共四篇),本系列以独特的视角,比较了非互联网和互联网两个时代以及传统与非传统两个行业.是对数据平台发展的一个回忆,对非互联网.互联网,从数据平台的用户角度.数据架构演进.模型等进行了阐述. 前言,”数据模型“ 这个词只要是跟数据沾边就会出现的一个词,在数据库设计.数据仓库.数据挖掘上.业务里都存在,聚焦一下,这里提到的是数据平台中的”数据模型“. 这是一个非常的抽象词,个人也很难用简单语言把他描述出来,这一章也是整个系列中较为抽象的

读懂BI商业智能与大数据应用的区别

之所以要区分大数据应用与BI(商业智能),是因为大数据应用与BI.数据挖掘等,并没有一个相对完整的认知. BI(BusinessIntelligence)即商务智能,它是一套完整的解决方案,用来将企业中现有的数据进行有效的整合,快速准确的提供报表并提出决策依据,帮助企业做出明智的业务经营决策. 伴随着BI的发展,是ETL,数据集成平台等概念的提出.ETL,Extraction Transformation Loading,数据提取.转换和加载,数据集成平台主要功能对各种业务数据进行抽取和相关转化

大数据架构和模式(四)——了解用于大数据解决方案的原子模式和复合模式

摘要:本文中介绍的模式有助于定义大数据解决方案的参数.本文将介绍最常见的和经常发生的大数据问题以及它们的解决方案.原子模式描述了使用.处理.访问和存储大数据的典型方法.复合模式由原子模式组成,并根据大数据解决方案的范围进行分类.由于每个复合模式都有若干个维度,所以每个模式都有许多变化.复合模式使得业务和技术用户可以应用一个结构化方法为大数据问题建立范围,并定义高级的解决方案. 简介 本系列的 第 3 部分 介绍了大数据解决方案的逻辑层.这些层定义了各种组件,并对它们进行分类,这些组件必须处理某个

大数据架构和模式(四)了解用于大数据解决方案的原子模式和复合模式

本文收藏于:http://kb.cnblogs.com/page/510982/ 作者: Divakar等  来源: DeveloperWorks  发布时间: 2015-01-29 18:21   推荐: 0   原文链接   [收藏] 摘要:本文中介绍的模式有助于定义大数据解决方案的参数.本文将介绍最常见的和经常发生的大数据问题以及它们的解决方案.原子模式描述了使用.处理.访问和存储大数据的典型方法.复合模式由原子模式组成,并根据大数据解决方案的范围进行分类.由于每个复合模式都有若干个维度,

探索大数据理论

最早的大数据这个概念是由McKinsey提出的,他认为在当今世界,已经渗透到各个行业及其业务职能的各个领域的数据已成为生产人员能够开采和利用海量数据的一个重要原因,可以看出,新的生产率上升和消费者盈利的大潮即将到来. 行业中最早对大数据进行定义的是IBM,它将其展开并分为四个特质,那就是量,多种类,价值和速度.深入分析来看,大数据的这四个层次可以一一进行剖析:首先,数据量是巨大的,对于大数据的初始计量的单位至少也是P(相当于一千T),E(相当于一百万T)或Z(相当于十亿T);其次是数据的类型品种

学习大数据基础框架hadoop需要什么基础

什么是大数据?进入本世纪以来,尤其是2010年之后,随着互联网特别是移动互联网的发展,数据的增长呈爆炸趋势,已经很难估计全世界的电子设备中存储的数据到底有多少,描述数据系统的数据量的计量单位从MB(1MB大约等于一百万字节).GB(1024MB).TB(1024GB),一直向上攀升,目前,PB(等于1024TB)级的数据系统已经很常见,随着移动个人数据.社交网站.科学计算.证券交易.网站日志.传感器网络数据量的不断加大,国内拥有的总数据量早已超出 ZB(1ZB=1024EB,1EB=1024PB

学习hadoop大数据基础框架需要什么基础

什么是大数据?进入本世纪以来,尤其是2010年之后,随着互联网特别是移动互联网的发展,数据的增长呈爆炸趋势,已经很难估计全世界的电子设备中存储的数据到底有多少,描述数据系统的数据量的计量单位从MB(1MB大约等于一百万字节).GB(1024MB).TB(1024GB),一直向上攀升,目前,PB(等于1024TB)级的数据系统已经很常见,随着移动个人数据.社交网站.科学计算.证券交易.网站日志.传感器网络数据量的不断加大,国内拥有的总数据量早已超出 ZB(1ZB=1024EB,1EB=1024PB

大数据是啥,可以吃的吗?

作者|影姿 关于大数据是什么,从一开始仅仅只想做数据,到开始意识到自己做的是对整个集团有核心意义的数据产品,再到走到外面,把数据能力对外输出,所有过程中,不断的有客户问到这个问题,有懵懂的.有善意的.也有挑衅的.不屑的.就像大数据本身一样,混乱又带有迷幻色彩. 现在对大数据的理解有两种极端:站在大数据的风口,很多人觉得大数据是未来,可以解决所有问题,包括人工智能:我自己不用想,大数据已经替我想好决定好一切了:还有一种,是大数据的概念炒了好几年,冷饭都抄成锅巴了,但是尝试过人的只收集齐了几万点伤害