面试:谈谈你对大数据的理解

大数据概念:

  大数据(big data):指无法在一定时间范围内用常规软件工具进行捕捉、管理和处理的数据集合,

           是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。

  主要解决:海量数据的存储和海量数据的分析计算问题。

大数据的4V特性:

Volume(大量):数据体量巨大,PB级->EB级->ZB级

Velocity  (高速) :数据输入输出的速度要求快

Variety  (多样):多样性让数据被分为结构化数据和非结构化数据。非结构化数据包括网络日志、音频、视频、图片、地理位置信息等。

Value (价值):价值密度低,商业价值高

大数据无处不在,大数据应用于各个行业,

例如汽车行业:利用大数据和物联网技术实现无人驾驶汽车;

物流行业:利用大数据优化物流网络,提高物流效率,降低物流成本等等;

大数据还可以应用于个人生活,利用与每个人相关联的“个人大数据”,分析个人生活行为习惯,为其提供更加周到的个性化服务。

原文地址:https://www.cnblogs.com/dummyly/p/10080654.html

时间: 2024-10-11 12:59:54

面试:谈谈你对大数据的理解的相关文章

我对软件行业及大数据的理解

对软件行业的理解 可以用需求.架构.工具和算法四个词对软件行业做一个整体的概括. 需求是推动软件行业发展的源动力,需求的变化带来了架构.工具和算法的进步. 架构这个层面上,主要涉及的是一种解决问题的思想和策略,好的架构的诞生源于对需求和技术的深入了解,但与具体的技术实现联系不是太紧密. 工具是有需求带动的,工具的产生会受到架构的限制,不同的工具一般对某一领域更擅长. 算法的进步依赖于基础学科,是对具体问题的优化处理. 总之,无论是需求.架构.工具,还是算法,很少出现跳跃性的进步和创新,大多是在以

面试:谈谈你对Spring框架的理解

Spring是一个优秀的轻量级框架,大大的提高了项目的开发管理与维护.Spring有两个核心模块.一个是IOC,一个是AOP. IOC: 就是控制反转的意思,指的是我们将对象的控制权从应用代码本身转移到外部容器.通过IOC容器在程序运行期间基于JAVA反射机制 动态的创建对象,配置对象,建立对象之间的依赖关系,管理对象的生命周期.而DI作为依赖注入,是实现IOC控制反转的一种手段.常见的依赖注入方式有:set方式注入和构造器方式注入.通过依赖注入在程序运行期间动态的注入依赖对象,建立对象之间的依

CSDN专访:大数据时代下的商业存储

原文地址:http://www.csdn.net/article/2014-06-03/2820044-cloud-emc-hadoop 摘要:EMC公司作为全球信息存储及管理产品方面的领先公司,不久前,EMC宣布收购DSSD加强和巩固了其在行业内的领导地位,日前我们有幸采访到EMC中国的张安站,他就大数据.商业存储.Spark等给大家分享了自己的看法. 谈到大数据,张安站认为大数据本质上是两个根本性的问题,一个是数据很大,如何存储?另外一个是数据很大,如何分析?第一个问题,对于存储厂商来说,就

大数据和「数据挖掘」是何关系?---来自知乎

知乎用户,互联网 244 人赞同 在我读数据挖掘方向研究生的时候:如果要描述数据量非常大,我们用Massive Data(海量数据)如果要描述数据非常多样,我们用Heterogeneous Data(异构数据)如果要描述数据既多样,又量大,我们用Massive Heterogeneous Data(海量异构数据)--如果要申请基金忽悠一笔钱,我们用Big Data(大数据) 编辑于 2014-02-2817 条评论感谢 收藏没有帮助举报作者保留权利 刘知远,NLPer 4 人赞同 我觉得 大数据

大数据思维

本周也没有学习到什么内容.跟自己相关的云计算的课还排在周日.就俗一点,也来谈谈什么是大数据思维. 笼统地来说,是一种思维方式.也是一种考虑问题的逻辑结构.简单一点来说,就是根据已知推断未来的过程.复杂一点就是,根据大量的已知条件,通过相应的祛伪存真,然后根据这些条件去判断我们所要知道的答案. 举一个简单的例子,也不知道是不是大数据思维,还望各位大牛们评判一下.中午跟两朋友一起去吃饭,A君说他下午要见一个9年未见的同学,而且是女同学.我就让B君,准备一下,下午可以去试试,说不定能成就一段姻缘.判断

2018年大数据面试题总结

目前面试了多家大数据开发工程师,成长了很多,也知道了很多知识,下面和大家分享一下我遇到的面试题和答案. 1.kafka集群的规模,消费速度是多少. 答:一般中小型公司是10个节点,每秒20M左右. 2.hdfs上传文件的流程. 答:这里描述的 是一个256M的文件上传过程 ① 由客户端 向 NameNode节点节点 发出请求 ②NameNode 向Client返回可以可以存数据的 DataNode 这里遵循机架感应原则 ③客户端 首先 根据返回的信息 先将 文件分块(Hadoop2.X版本 每一

四种武器--大数据与R,python,SAS,SPSS的关系?

武林中人很多都要求自己各种兵器都能够使用,但每个人都会有一个自己最擅长的兵器.以前这四种软件就如大数据里的"刀枪棍棒".兵器只是一部分,重要的还是我们自身对于大数据的理解,也就相当于是内功.毕竟,双方比武,兵器取胜的部分是很大,但不是决定因素!试想,一个内功高深的人跟一个只会使枪的人来比试,说不定对方摘叶就可以伤到那个只会使剑的人.......... 好吧!我们就一一揭开这四种"武器"的面纱! 先说R,与其说是一门语言,不如说是一个软件.他更多的应用是在数据量在中小

中科院 | 大数据的力量来自“大成智慧”信息时代大数据的再认识

文章出处:http://www.thebigdata.cn/YeJieDongTai/29119.html 大数据已成为媒体与大众关注的新技术,大数据的应用也预示着信息时代将进入一个新阶段,但人们对大数据的认识有一个不断加深的过程.首先从"信息时代新阶段".数据文化和认识论的高度阐述了对大数据的理解;接着通过对驱动效益和大成智慧的解释,探讨了如何正确认识大数据的价值和效益,并从复杂性的角度分析了大数据研究和应用面临的挑战;最后对发展大数据应避免的误区提出几点看法. 1 大数据兴起预示&

大数据,只看这个就够了

2016年5月25日上午,由贵州省政府举办的以"大数据开启智能时代"为主题的中国大数据产业峰会在贵阳开幕,国务院总理李克强发表主旨演讲.腾讯集团马化腾,高通公司总裁Derek Aberle,百度公司李彦宏,微软全球陆奇,京东集团刘强东,阿里巴巴王坚,滴滴出行程维,HTC王雪红,戴尔Michael Dell等重要嘉宾出席会议并发言.至此,大数据发展已经上升到国家战略层次,其热度可见一斑.如图一为李克强总理发表讲话: 图一 自2016年起,大数据与人工智能,虚拟现实相继重新进入了我们的视线