《大数据时代》读后小结

  "云计算",“大数据”的概念风起云涌,一时貌似所有的人都成了“大数据专家”,多多少少都能侃两句,为了适应时代的发展,抽时间看了看《大数据时代》,简单谈一下自己的理解。 大数据的核心就是预测,通过历史数据预测未来。它通常被视为人工智能的一部分,或者更确切地说,被视为一种机器学习。然而对大数据的分析方式与人们的传统思维还是有很大转变的。
  第一个转变就是在大数据时代,我们可以分析更多的数据,有时候甚至可以处理和某个特别现象有关的所有数据,而不再依赖于随机采样,即样本=总体。第二个转变就是,研究数据如此之多,以至于我们不再追求精确度,当然我们也不是完全放弃了精确度,只是不再沉迷于此。第三个转变因前两个转变而促成,即我们不再热衷于寻找因果关系,而应该寻找事物之间的相关关系,我认为第三个转变是该书的重中之重。大数据告诉我们“是什么”而不是“为什么”,在大数据时代,我们有时不必知道现象背后的原因,我们只要让数据自己发声,相关关系将会大放异彩。
  通过相关关系可以预测事件的发生,事态的走势,总而言之就是预测未来,书中提到几个预测未来的例子:Farecast利用机票销售数据来预测未来的机票价格;谷歌重复使用搜索关键词来检测流感的传播;麦格雷戈博士用婴儿的生命体征来预测传染病的发生;莫里重新利用老船长的日志而发现了洋流。利用好大数据,挖掘出数据中潜藏着的价值,会给我们莫大的帮助。
  大数据虽然能为我们创造价值,但是我们必须杜绝数据的过分依赖,以防我们重蹈伊卡洛斯的覆辙。大数据能帮助我们更好地进行已有的工作,并处理全新的事物。但它绝不是魔术棒,不会带来世界和平,无法根绝贫穷问题,更不能创造出另一个毕加索。

时间: 2024-10-25 04:37:33

《大数据时代》读后小结的相关文章

大数据时代,一个无比黑暗的时代

所有的讨论从一个笑话开始.讨论本身可能无意义,但是感觉这件事蛮有意思,那么记下来也就蛮有意义了. 某必胜客店的电话铃响了,客服人员拿起电话.客服:必胜客.您好,请问有什么需要我为您服务?顾客:你好,我想要一份……客服:先生,烦请先把您的会员卡号告诉我.顾客:16846146***.客服:陈先生,您好!您是住在泉州路一号12楼1205室,您家电话是2646****,您公司电话是4666****,您的手机是1391234****.请问您想用哪一个电话付费?顾客:你为什么知道我所有的电话号码?客服:陈

读<<大数据时代>>的一些感想

第一次听说<<大数据时代>>这本书,是在网上看到的央视搞的一个2013中国好书评选活动推荐的25本"中国好书"的榜单中看到的.然后迅速上豆瓣上查看了一下对该书的评价,一看非常高,再加上央视的推荐是从2013在中国出版的40册图书中选出25本,可以说是精华了.果断定了一本,花了三天时间读完了.   大数据这个名词或者说概念从被提出开始,经过短短几年的发展,已经传的沸沸扬扬了,经常见诸媒体上.好像哪家媒体的科技板块每天不弄一些这样的新闻条,它就显得不够档次一样.这是

转文峰——读《大数据时代》有感

我在大数据领域已经工作五年多了,可如果一个外行朋友让我给他解释一 下什么是大数据,我还真不好讲.我能说就是海量数据的格式化.传输.存储.查询.展示吗?还是过于抽象.我能说数据量大就叫大数据吗?其实也不一定,一台 机器上的传感器收集到的数据可能每天都有几个TB,但也仅仅是监控了一个机器的状态.而全国各个市一天的苹果价格,可能也只是几MB大小,但它就是一个大 数据的例子. 这本书的观点很鲜明.首先是样本等于总体.在大数据时代以前,如果想要了解某个市场的情况,一般是采用抽样调查的方式,这种方式难免出现

读《大数据时代》

周末两天加上今天的时间,算是仔细的读完了<大数据时代>这本书,这本书既是我导师推荐给我们的大数据书籍,也是我第一次尝试一口气读完一本书. 对于这本书,作者的牛逼之处就不用我在这里废口水了.这里主要说说的体会. 现在谈论大数据的人真的很多,但是能全面的讲述大数据的人我个人的感觉是不多的.作者从非技术这个角度,从思维.价值.隐私.管理这些角度来细致的讲述大数据,这点我觉得是值得我们学习的,而且书中例子的结合,也很能看出作者的功力. 结合产品来谈数据的话,我个人觉得产品的设计是可以融入数据元素的,从

LinkedIn高级分析师王益:大数据时代的理想主义和现实主义(图灵访谈)

转自:http://www.ituring.com.cn/article/75445 王益,LinkedIn高级分析师.他曾在腾讯担任广告算法和策略的技术总监,在此期间他发明了并行机器学习系统“孔雀”,它可以从数十亿的用户行为或文本数据中学习到上百万的潜在主题,该系统被应用在腾讯可计算广告业务中.在此之前,他在Google担任软件工程师,并开发了一个分布式机器学习工具,这个工具让他获得了2008年的“Google APAC 创新奖”.王益曾在清华大学和香港城市大学学习,并取得了清华大学机器学习和

决胜大数据时代:Hadoop&amp;Yarn&amp;Spark企业级最佳实践(8天完整版脱产式培训版本)

Hadoop.Yarn.Spark是企业构建生产环境下大数据中心的关键技术,也是大数据处理的核心技术,是每个云计算大数据工程师必修课. 课程简介 大数据时代的精髓技术在于Hadoop.Yarn.Spark,是大数据时代公司和个人必须掌握和使用的核心内容. Hadoop.Yarn.Spark是Yahoo!.阿里淘宝等公司公认的大数据时代的三大核心技术,是大数据处理的灵魂,是云计算大数据时代的技术命脉之所在,以Hadoop.Yarn.Spark为基石构建起来云计算大数据中心广泛运行于Yahoo!.阿

《大数据时代》读书笔记

大数据开启了一次重大的时代转型.就像望远镜让我们能够感受宇宙,显微镜让我们能够 观测微生物一样,大数据正在改变我们的生活以及理解世界的方式,成为新发明和新服务的源 泉,而更多的改变正蓄势待发-- 大数据的精髓在于我们分析信息时的三个转变,这些转变将改变我们理解和组建社会的方法. 第一个转变就是,在大数据时代,我们可以分析更多的数据,有时候甚至可以处理和第一个转变就是,在大数据时代,我们可以分析更多的数据,有时候甚至可以处理和 某个特别现象相关的所有数据,而不再依赖于随机采样. 某个特别现象相关的

第29本:《大数据时代》

第29本:<大数据时代> 最近大数据火了,还经常听到Hadoop和Mapreduce,我经常勘探地震资料处 理后的地震数据体,动不动几十个G,算不算大数据?好像与现在说的这个大数据概念相差太远,就一直想了解一下这个大数据到底是什么含义.从SUN那里借来 <大数据时代>读了一读,明白了不少基本概念和示例,与我们的数GB的地震数据体不是一回事,想把大数据应用于石油行业,看来还得琢磨琢磨. <大数据时代>这本书的章节划分非常清晰,主要讲了思维.商业和管理方面的变革,每一章有一

大数据时代的技术hive:hive介绍

我最近研究了hive的相关技术,有点心得,这里和大家分享下. 首先我们要知道hive到底是做什么的.下面这几段文字很好的描述了hive的特性: 1.hive是基于Hadoop的一个数据仓库工具,可以将结构化的数据文件映射为一张数据库表,并提供完整的sql查询功能,可以将sql语句转换为MapReduce任务进行运行.其优点是学习成本低,可以通过类SQL语句快速实现简单的MapReduce统计,不必开发专门的MapReduce应用,十分适合数据仓库的统计分析. 2.Hive是建立在 Hadoop