"云计算",“大数据”的概念风起云涌,一时貌似所有的人都成了“大数据专家”,多多少少都能侃两句,为了适应时代的发展,抽时间看了看《大数据时代》,简单谈一下自己的理解。 大数据的核心就是预测,通过历史数据预测未来。它通常被视为人工智能的一部分,或者更确切地说,被视为一种机器学习。然而对大数据的分析方式与人们的传统思维还是有很大转变的。
第一个转变就是在大数据时代,我们可以分析更多的数据,有时候甚至可以处理和某个特别现象有关的所有数据,而不再依赖于随机采样,即样本=总体。第二个转变就是,研究数据如此之多,以至于我们不再追求精确度,当然我们也不是完全放弃了精确度,只是不再沉迷于此。第三个转变因前两个转变而促成,即我们不再热衷于寻找因果关系,而应该寻找事物之间的相关关系,我认为第三个转变是该书的重中之重。大数据告诉我们“是什么”而不是“为什么”,在大数据时代,我们有时不必知道现象背后的原因,我们只要让数据自己发声,相关关系将会大放异彩。
通过相关关系可以预测事件的发生,事态的走势,总而言之就是预测未来,书中提到几个预测未来的例子:Farecast利用机票销售数据来预测未来的机票价格;谷歌重复使用搜索关键词来检测流感的传播;麦格雷戈博士用婴儿的生命体征来预测传染病的发生;莫里重新利用老船长的日志而发现了洋流。利用好大数据,挖掘出数据中潜藏着的价值,会给我们莫大的帮助。
大数据虽然能为我们创造价值,但是我们必须杜绝数据的过分依赖,以防我们重蹈伊卡洛斯的覆辙。大数据能帮助我们更好地进行已有的工作,并处理全新的事物。但它绝不是魔术棒,不会带来世界和平,无法根绝贫穷问题,更不能创造出另一个毕加索。
时间: 2024-10-25 04:37:33