转文峰——读《大数据时代》有感

我在大数据领域已经工作五年多了,可如果一个外行朋友让我给他解释一 下什么是大数据,我还真不好讲。我能说就是海量数据的格式化、传输、存储、查询、展示吗?还是过于抽象。我能说数据量大就叫大数据吗?其实也不一定,一台 机器上的传感器收集到的数据可能每天都有几个TB,但也仅仅是监控了一个机器的状态。而全国各个市一天的苹果价格,可能也只是几MB大小,但它就是一个大 数据的例子。
  

  这本书的观点很鲜明。首先是样本等于总体。在大数据时代以前,如果想要了解某个市场的情况,一般是采用抽样调查的方式,这种方式难免出现偏
差,比如配合调查的人群,可能本身就有倾向性。但在大数据时代,我们直接面向的是总体样本,能够直接分析总体的真实情况,更加客观。过去有两个条件不具
备,一个是数据的采集代价很大,现在通过网络可能直接拿到。比如全国人民今天都关心什么,会在搜索引擎的查询记录里体现出来。第二是计算和存储能力不具
备,成千上万台的高性能服务器才能迅速计算出结果,在以前的计算器年代是搞不定的。

  

  第二个观点是要关联关系而不关心因果性。买了A东西的人很有可能买B东西,可能这两者看似没有什么关联,但尽管把它们放在一起就是了,我们最
关心的是销量,不是吗?弄清楚是怎么一个表象可能比较容易,但是想弄清楚背后的缘由,就需要很大的代价了,在这种快速变化的时代,不妨先利用这种关联性去
产生价值,剩下的慢慢去分析。

  

  我在读这本书的时候,也在思考大数据到底是有什么样的特征?和以前的时代到底有何不同?我觉得是在地域上要具有广泛性,比如开始我说的全国各
个市苹果价格的例子,如果有了这样的信息,你就可以确定苹果运送到哪里能赚更多的钱,考虑的更长远一点是在哪里种苹果最划算。书中还列举了一个所有航班票
价的例子,也是类似的。

  

  在大数据时代,我预测传感器领域会有十足的发展,也许以后传感器无处不在,我们通过传感器获取到各种的数据,基于这些数据能实现一些新的价
值。现在流行的可穿戴设备,只是传感器的一个基本应用。Google的无人驾驶汽车也是一个应用的例子。但传感器时代我相信还没有到来,现在是一个酝酿
期。

时间: 2024-08-06 20:07:30

转文峰——读《大数据时代》有感的相关文章

读<<大数据时代>>的一些感想

第一次听说<<大数据时代>>这本书,是在网上看到的央视搞的一个2013中国好书评选活动推荐的25本"中国好书"的榜单中看到的.然后迅速上豆瓣上查看了一下对该书的评价,一看非常高,再加上央视的推荐是从2013在中国出版的40册图书中选出25本,可以说是精华了.果断定了一本,花了三天时间读完了.   大数据这个名词或者说概念从被提出开始,经过短短几年的发展,已经传的沸沸扬扬了,经常见诸媒体上.好像哪家媒体的科技板块每天不弄一些这样的新闻条,它就显得不够档次一样.这是

《大数据时代》读后小结

"云计算","大数据"的概念风起云涌,一时貌似所有的人都成了"大数据专家",多多少少都能侃两句,为了适应时代的发展,抽时间看了看<大数据时代>,简单谈一下自己的理解. 大数据的核心就是预测,通过历史数据预测未来.它通常被视为人工智能的一部分,或者更确切地说,被视为一种机器学习.然而对大数据的分析方式与人们的传统思维还是有很大转变的. 第一个转变就是在大数据时代,我们可以分析更多的数据,有时候甚至可以处理和某个特别现象有关的所有数据,而

读《大数据时代》

周末两天加上今天的时间,算是仔细的读完了<大数据时代>这本书,这本书既是我导师推荐给我们的大数据书籍,也是我第一次尝试一口气读完一本书. 对于这本书,作者的牛逼之处就不用我在这里废口水了.这里主要说说的体会. 现在谈论大数据的人真的很多,但是能全面的讲述大数据的人我个人的感觉是不多的.作者从非技术这个角度,从思维.价值.隐私.管理这些角度来细致的讲述大数据,这点我觉得是值得我们学习的,而且书中例子的结合,也很能看出作者的功力. 结合产品来谈数据的话,我个人觉得产品的设计是可以融入数据元素的,从

LinkedIn高级分析师王益:大数据时代的理想主义和现实主义(图灵访谈)

转自:http://www.ituring.com.cn/article/75445 王益,LinkedIn高级分析师.他曾在腾讯担任广告算法和策略的技术总监,在此期间他发明了并行机器学习系统“孔雀”,它可以从数十亿的用户行为或文本数据中学习到上百万的潜在主题,该系统被应用在腾讯可计算广告业务中.在此之前,他在Google担任软件工程师,并开发了一个分布式机器学习工具,这个工具让他获得了2008年的“Google APAC 创新奖”.王益曾在清华大学和香港城市大学学习,并取得了清华大学机器学习和

移动大数据时代最IN编程语言必读书单

移动大数据时代最IN编程语言必读书单 这是一个快速更迭,快鱼吃慢鱼的时代.从IT 时代演变成 DT 时代,再到现在的智能时代.急速革新的各种新技术.新工具.新平台,需要程序员掌握良好的编程思想和学习方法,不断学习新技术.补充新知识,才能努力跟上时代的步伐,找到自我实现的际遇.读书依然是我们获取知识的最方便和有效的途径之一.既要读经典,也要读新书,前者让你沉淀,发现正确的方法,后者让你紧跟前沿,掌握最新的技术.可你是不是担心,不能找到真正值得读的新书而浪费时间?在此,我们汇总了当下最In的编程语言

看大数据时代下的IT架构(1)图片服务器之演进史

        柯南君的公司最近产品即将上线,由于产品业务对图片的需求与日俱增,花样百出,与此同时,在大数据时代,大流量的冲击下,对图片服务器的压力可想而知,那么今天,柯南君结合互联网的相关热文,加上自己的一点实践经验,与君探讨,与君共勉! 一.图片服务器的重要性 当前,不管哪一家网站(包括 电商行业.O2O行业.互联网行业等),不管哪一种渠道 (包括 web端,APP端甚至一些SNS应用),在大数据时代下,在内容为王的前提下,对图片的需求量越来越大,柯南君的公司是一家O2O公司,也不例外,图片

当不再炒作大数据的时候,大数据时代就真的来了

从2015年开始,大数据就已经被移出了Gartner的新兴技术炒作曲线."Big Data"(大数据)一词最早于2011年8月出现在Gartner新兴技术炒作曲线中,当时Gartner预计大数据技术需要2年到5年才能进入企业的实际生产型应用中.从那以后,大数据就迅速被市场热炒,最终在2015年彻底在Gartner新兴技术炒作曲线中消失. 进入2016年,大数据已经进入了实际的企业生产应用,在切实推动企业向数字化转型.另一家市场调查公司IDC则强调,在未来5年中,全球的数据驱动型企业将获

决胜大数据时代:Hadoop&amp;Yarn&amp;Spark企业级最佳实践(8天完整版脱产式培训版本)

Hadoop.Yarn.Spark是企业构建生产环境下大数据中心的关键技术,也是大数据处理的核心技术,是每个云计算大数据工程师必修课. 课程简介 大数据时代的精髓技术在于Hadoop.Yarn.Spark,是大数据时代公司和个人必须掌握和使用的核心内容. Hadoop.Yarn.Spark是Yahoo!.阿里淘宝等公司公认的大数据时代的三大核心技术,是大数据处理的灵魂,是云计算大数据时代的技术命脉之所在,以Hadoop.Yarn.Spark为基石构建起来云计算大数据中心广泛运行于Yahoo!.阿

张书乐:“神偷拍”抓了神偷 大数据时代让手规矩点

在大数据时代,每一个人的行为,都会因为数据的细微变化,而出现各种个性化的特征. 文/张书乐 日前,株洲媒体报道了个很正经的本地奇闻,一个扒手扒窃了个女大学生小佳的智能手机,却恰巧被和小佳同行的闺蜜无意间拍了下来,结果报警.登报.摸排.抓获,一切都飞快的完成.而一切的起因,仅仅是两个女生平时有偷拍对方"吃相"丑照互动的习惯. 据说,扒手第二天上街,在报纸上看到自己的照片,吓得哆嗦. 这一幕似乎一直都是在大片中看过,比如系列美剧<疑犯追踪>,各种根据摄像头下不同人的行为举止来判