大数据时代下的生活

  最近几年IT都成长在一个大数据的环境下,大家动不动就要分布式,想想就搞大数据。有的网站明明访问量几台普通的服务器就可以搞定,非要弄分布式,挂着云计算的名字,却做着屌丝的事情。

  虽然,大环境如此,但是为了沾上这种高大上的气息,也着手看一下这方面的书。

  刚刚看完《大数据时代》这本书,感觉收获也蛮多的。习惯性的整理了一下书籍的思维导图

  这本书是国外人写的,但是内容上还比较符合国内目前的环境,毕竟国内的大数据发展起步还是要晚一点的。

  个人吐槽

  就从法律这方面来说,感觉国内的个人隐私方面法律就不怎么看重,因此即便某些软件或者网站侵犯了用户的个人隐私,用户也极少会采取一定的措施。况且很多网站或者软件在不显眼或者让人不在意的地方使用了 声明许可......简直是推卸责任的最佳方案。

  就这点来说,书中提倡,不应该采用个人许可这种类似的手段来避免大数据的使用责任,而是应该由使用方来承担责任

  这样,使用数据的人就会在使用过程中,去了解什么地方可能触犯了用户的隐私,什么地方可能会让用户陷入尴尬的困境,从而使用模糊化或者匿名化的手段来避免。

  模糊化就是不给出数据的具体内容,只是粗略的描述。

  而匿名化就好理解了,就是隐藏掉用户的关键信息。

  就目前的互联网公司,也有很多公司根本不注重这种细节,就我特别反感的一点来说:

  京东目前应该说是互联网产业很火的一个产品了...由于它的东西很多都是京东自营的,质量上总是感觉比淘宝要有保障。因此,我买东西能在京东上买,就绝对不会去淘宝。但是京东的购物历史,却很是让人尴尬!

  比如下面这些标红的地方,是购物的评价区

  点击上面的用户名,就直接可以看到这个人的消费历史。当然这个历史记录是可以关闭,不显示的。但是默认上来都是开启的,一般用户也不会在意。但是如果查看某XX斯这种尴尬的产品,查看其用户,就可以发现很多有意思的购物历史。

  这里就当做一个吐槽吧!这虽然不是什么大数据,购物历史应该说是简单的历史数据了。但是这也算是泄露了用户的隐私吧。

  大数据流程

  其次呢,我们目前的这种生活环境,每天会产生大量的数据,这些数据利用好了,可以为我们进行一定的数据可视化,分析或者预测出生活中一些即将发生,我们有意去关注的事情。

  因此好坏参半,大数据的使用还要看具体来做什么。

  总的来说,其中的商机以及潜在的机会都是非常大的,如何有效的搜集数据,如何有效的利用分析数据才是目前最应该关注的事情。

  大体上无非都是这些步骤:

  1 数据一般都是某些应用的记录,或者消息

  2 有了数据,需要对数据进行有效的采集,存储,查询。

  这里就涉及到一定的技术了,采集需要对业务进行分析,在有效的地方进行记录。存储需要考虑数据的增长量,或者安全性,是否会由于庞大的数据而存不存下,是否会因为某些故障而漏掉信息,这个时候就要高一些分布式存储之类的了。最后的查询,可能会设计到一些搜索啊,MapReduce之类的。

  3 数据已经有了,就要对数据进行分析了。这一块基于某些业务肯定有不同的搜集方法,具体看业务而定吧。

  4 数据的用途:既可以采取数据的可视化进行数据的直观展现,也可以利用数据进行一些趋势动向的分析预测,还可以进行某些特定预测的预警等等。

  大数据的时代,重要的是数据的搜集,相关的技术,以及如何使用这些数据。

  以上的博文,纯属个人的无聊记录与吐槽,设计到某些互联网的公司的部分,也是纯属希望能够做得更好。

  正如书中的最后一句话,凡是过去,皆为序曲

  个人理解,过去的历史数据可能就直接丢掉了,但是现在我们应该利用这些数据,去做更有价值的事情。

时间: 2024-08-11 03:36:28

大数据时代下的生活的相关文章

看大数据时代下的IT架构(1)图片服务器之演进史

        柯南君的公司最近产品即将上线,由于产品业务对图片的需求与日俱增,花样百出,与此同时,在大数据时代,大流量的冲击下,对图片服务器的压力可想而知,那么今天,柯南君结合互联网的相关热文,加上自己的一点实践经验,与君探讨,与君共勉! 一.图片服务器的重要性 当前,不管哪一家网站(包括 电商行业.O2O行业.互联网行业等),不管哪一种渠道 (包括 web端,APP端甚至一些SNS应用),在大数据时代下,在内容为王的前提下,对图片的需求量越来越大,柯南君的公司是一家O2O公司,也不例外,图片

CSDN专访:大数据时代下的商业存储

原文地址:http://www.csdn.net/article/2014-06-03/2820044-cloud-emc-hadoop 摘要:EMC公司作为全球信息存储及管理产品方面的领先公司,不久前,EMC宣布收购DSSD加强和巩固了其在行业内的领导地位,日前我们有幸采访到EMC中国的张安站,他就大数据.商业存储.Spark等给大家分享了自己的看法. 谈到大数据,张安站认为大数据本质上是两个根本性的问题,一个是数据很大,如何存储?另外一个是数据很大,如何分析?第一个问题,对于存储厂商来说,就

柯南君:看大数据时代下的IT架构(5)消息队列之RabbitMQ--案例(Work Queues起航)

一.回顾 让我们回顾一下,在上几章里都讲了什么?总结如下: <柯南君:看大数据时代下的IT架构(1)业界消息队列对比> <柯南君:看大数据时代下的IT架构(2)消息队列之RabbitMQ-基础概念详细介绍> <柯南君:看大数据时代下的IT架构(3)消息队列之RabbitMQ-安装.配置与监控> <柯南君:看大数据时代下的IT架构(4)消息队列之RabbitMQ--案例(Helloword起航)> 二.Work Queues(using the Java Cl

看大数据时代下的IT架构(1)业界消息队列对比

一.MQ(Message Queue) 即消息队列,一般用于应用系统解耦.消息异步分发,能够提高系统吞吐量.MQ的产品有很多,有开源的,也有闭源,比如ZeroMQ.RabbitMQ.ActiveMQ.Kafka/Jafka.Kestrel.Beanstalkd.HornetQ.Apache Qpid.Sparrow.Starling.Amazon SQS.MSMQ等,甚至Redis也可以用来构造消息队列.至于如何取舍,取决于你的需求. 由于工作需要和兴趣爱好,曾经写过关于RabbitMQ的系列博

柯南君:看大数据时代下的IT架构(6)消息队列之RabbitMQ--案例(Publish/Subscribe起航)

一.回顾 让我们回顾一下,在上几章里都讲了什么?总结如下: <柯南君:看大数据时代下的IT架构(1)业界消息队列对比> <柯南君:看大数据时代下的IT架构(2)消息队列之RabbitMQ-基础概念详细介绍> <柯南君:看大数据时代下的IT架构(3)消息队列之RabbitMQ-安装.配置与监控> <柯南君:看大数据时代下的IT架构(4)消息队列之RabbitMQ--案例(Helloword起航)> <柯南君:看大数据时代下的IT架构(5)消息队列之Rab

柯南君:看大数据时代下的IT架构(4)消息队列之RabbitMQ--案例(Helloword起航)

一.回顾 让我们回顾一下,在上几章里都讲了什么?总结如下: <柯南君:看大数据时代下的IT架构(1)业界消息队列对比> <柯南君:看大数据时代下的IT架构(2)消息队列之RabbitMQ-基础概念详细介绍> <柯南君:看大数据时代下的IT架构(3)消息队列之RabbitMQ-安装.配置与监控> 二.起航 本章节,柯南君将从几个层面,用官网例子讲解一下RabbitMQ的实操经典程序案例,让大家重新回到经典"Hello world!"(The simpl

大数据时代下是数据思维重要,还是相应技术重要?

技术做到一定程度,逐步发现自己的瓶颈.不由得开始思考这一方面的问题!到底大数据时代下,是相应的数据分析技术重要,还是相应数据思维重要? 先来说数据思维吧!什么是大数据思维,个人感觉应该是互联网思维的一种.是考虑到全面,而不是局部.是考虑到多维,而不是单一维度.不是靠拍脑门做决定,而是让数据说话,用数据做决策. 先说第一点,考虑全面,而不是局部.众所周知,移动互联网催生了大数据的产生.每一个人每一天通过手机能够的数据总和会是一个巨大的量.而通过这些非结构化的数据,我们首先面对的是如何处理这些数据,

大数据时代下电子商务发展新契机

大数据时代,电子商务面临新的挑战.电商想要得到更好的发展肯定离不开数据的支持,需从电商站点设计.移动搜索.社交媒体.转化率.停留率等方面来解读大数据时代电商的关键数据. 同时,电商企业需要针对大数据进行深度的分析和挖掘,从而为自身创造巨大的商机.随着大数据所爆发出的巨大潜力,在如今的互联网经济时代,电商企业正在用大数据思维与技术影响着企业业务决策和商业推广思路.可以预测的是,互联网平台大数据分析,必将在未来为电商企业精准营销带来融合性影响. 电商企业在后台如果能对海量的用户行为数据进行快速分析,

大数据时代下的数据挖掘与可视化展现

全世界每天都有几十亿人使用计算机.平板电脑.手机和其它数字设备产生海量数据.在这个各个行业和领域都已经被数据给渗透,数据已成为非常重要的生产因素的大数据时代,对于大数据处理和大数据挖掘将意味着新一波的生产率不断增长和消费者盈余浪潮的到来. 在大数据时代下,从头至尾我们都脱离不了数据挖掘.有人把数据比喻为蕴藏能量的煤矿.煤炭按照性质有焦煤.无烟煤.肥煤.贫煤等分类,而露天煤矿.深山煤矿的挖掘成本又不一样.与此类似,大数据并不在“大”,而在于“有用”.价值含量.挖掘成本比数量更为重要. 什么是数据挖