直接影响你薪资的一套大数据企业面试题,看完记得收藏转发哦!

经历了水深火热的大数据学习,终于拨开云雾见天明了,但你离成功总是还差了一步,那就是拿到大数据工程师的Offer。

在电脑旁奋斗了无数个日夜,代码敲了无数遍,项目整改了无数遍,只为了得到一份自己满意的高薪资高待遇的Offer。但这个收获不仅仅需要你学到娴熟的大数据技术,还需要在面试之前精心准备,了解自己要应聘的企业发展状况、 自己应聘岗位的技术要求等等,除此之外,多看一些大数据面试题也是很有必要的,给自己涨涨经验。

小编虽然不能帮你调查你理想企业的发展状况,但大数据常见面试题早已经为你准备好了,需要的尽快收入囊中吧!

1.scala 语言有什么特点,什么是函数式编程?有什么优点

2.scala 伴生对象有什么作用

3.scala 并发编程是怎么弄得,你对 actor 模型怎么理解有何优点

4.Spark如何处理结构化数据,Spark如何处理非结构话数据?

5.Spark性能优化主要有哪些手段?

6.对于Spark你觉得他对于现有大数据的现状的优势和劣势在哪里?

7.对于算法是否进行过自主的研究设计?

8.简要描述你了解的一些数据挖掘算法与内容

9.怎么用spark做数据清洗

10.跟我聊聊spark的应用,商场里广告投放,以及黄牛检测

11.spark读取 数据,是几个Partition呢? hdfs几个block 就有几个 Partition?

12.Mogodb和hbase的区别

13.开发中遇到的问题

14.HIVE的优化

15.linux的启动顺序

16.编译好的scala程序,运行时还需要scala环境吗

17.Write a java program to implement Stack in java.

18.Linkedlist和ArrayList的区别

19.hadoop中combiner的作用

20.用mr设计一个分组排重计数算法

21.用MapReduce找出存在公共好友的两个人

22.hdfs存储机制

23.MapReduce原理

24.hadoop运行原理

25.hadoop 的 namenode 宕机,怎么解决

26.Hbase 的特性,以及你怎么去设计 rowkey 和 columnFamily ,怎么去建一个table

27.Redis,传统数据库,hbase,hive 每个之间的区别(问的非常细)

28.说下对hadoop 的一些理解,包括哪些组件

29.详细讲解下你流式实时计算的项目部署以及收集的结果情况

30.实时流式计算框架,几个人,多长时间,细节问题,包括讲flume ,kafka ,storm 的各个的组件组成,你负责那一块,如果需要你搭建你可以完成么?

如果你也苦恼于转行求职数据分析类岗位,不知道如何下手?很多初学者,对大数据的概念都是模糊不清的,大数据是什么,能做什么,学的时候,该按照什么线路去学习,学完往哪方面发展,想深入了解,想学习的同学欢迎加入大数据学习企鹅群:458345782,有大量干货(零基础以及进阶的经典实战)分享给大家,并且有清华大学毕业的资深大数据讲师给大家免费授课,给大家分享目前国内最完整的大数据高端实战实用学习流程体系。

原文地址:http://blog.51cto.com/14042734/2323581

时间: 2024-10-09 00:03:29

直接影响你薪资的一套大数据企业面试题,看完记得收藏转发哦!的相关文章

出一套高端大气上档次的大数据开发面试题(刷起来!!!)

一千个读者眼中有一千个哈姆雷特,一千名 大数据 程序员心目中就有一千套 大数据面试题.本文就是笔者认为可以用来面试大数据 程序员的面试题. 这套题的题目跟公司和业务都没有关系,而且也并不代表笔者本人可以把这些题回答得非常好,笔者只是将一部分觉得比较好的题从收集的面试题里面抽出来了而已. 收集的面试题有以下三个来源: 笔者在准备面试的过程中搜集并整理过的面试题. 笔者在准备面试的过程中自己思考过的新题. 笔者在面试过程中遇到的觉得比较好的题. 好了不说废话了 上~~~~~~~题~~~~~~~~~

38套大数据,云计算,架构,数据分析师,Hadoop,Spark,Storm,Kafka,人工智能,机器学习,深度学习,项目实战视频教程

38套大数据,云计算,架构,数据分析师,Hadoop,Spark,Storm,Kafka,人工智能,机器学习,深度学习,项目实战视频教程 视频课程包含: 38套大数据和人工智能精品高级课包含:大数据,云计算,架构,数据挖掘实战,实时推荐系统实战,电视收视率项目实战,实时流统计项目实战,离线电商分析项目实战,Spark大型项目实战用户分析,智能客户系统项目实战,Linux基础,Hadoop,Spark,Storm,Docker,Mapreduce,Kafka,Flume,OpenStack,Hiv

225家中国大数据企业名单

225家中国大数据企业名单 先奉上一张中国大数据产业地图   公司 简介 地点 分类 注册 时间 注册地点 1 北京九章云极科技有限 面向企业,提供大数据基础环境和常见算法 海淀 基础架构:分析 2013.2.6 海淀 公司(Data Canvas) 库 2 广联达软件 售卖建筑材料价格信 海淀 数据源 1998.8.13 北京 息 3 上海鲁班软件有限公司 建筑业数据汇集平台 上海 数据源 2005.8.16 海淀 4 北京四维图新科技股份 地图和地理数据提供 海淀 数据源 2012.12.0

浅谈百度司南大数据企业的风向标

不知道什么时候大家都開始谈论大数据,筑尼玛第一次接触大数据是在今年年初出差的时候在机场见到的,筑尼玛比較喜欢看书所以当时就跟风买了一本维克托?迈尔?舍恩伯格的<大数据时代:生活.工作与思维的大变革>,只是由于工作比較忙一直放在角落里落灰,直到4月14日百度的新功能百度司南正式开售,筑尼玛才又開始好好的关注了下大数据. 筑尼玛是软件project师出生,所以自认为对数据还是比較敏感的,对于数据这东西,它一直是是企业发展重要工具,无论是客户数据还是財务数据,当时小筑做软件开发时自我认为发改委要求大

hadoop大数据高薪课程抢先看

大数据高薪课程抢先看,超人学院院长吴超老师主讲,Hadoop高薪课程精讲.小伙伴们,你还等什么,动动你的鼠标,高薪课程任你看. 网盘链接地址:http://pan.baidu.com/s/1nt3gQxj

大数据再突破,看百度如何变身“健康管家”

笔者对于中国超级计算机“天河一号”的印象在此之前一直都只有“强大”两个字,所以看到其就要成为“烂尾楼”时,和其他所有人一样,除了叹息, 也只有叹息.即便拥有再强大的硬件能力以及软件计算能力,但无法落地实践,那么无论多大的荣耀也将归于零.这个状态与2012年之前的大数据十分相似. 所以,中国首个疾病大数据预测系统——百度疾病预测的上线,可以算得上是中国医疗行业,乃至中国公共卫生管理事业的一件盛事.它宣告了大数据的公共卫生管理能力告别理论,进入实践阶段. 不过,当大数据真的实现大规模以及多流行性疾病

大数据企业架构师精品课程(大数据篇)

视频课程包含: 大数据企业架构师精品课程(大数据篇)包含01.hadoop100集全.02.大数据_HBase视频教程.03.大数据_Hive视频教程.04.大数据_Spark_视频教程.05.大数据_zookeeper视频教程.06.R语言速成实战.07.python等等! 2017最火的可能就数大数据了,这里给大家按照一定思路整理了全套大数据视频教程,涵盖大数据全部知识点. 本视频属于作者原创搜集整理!下载方式:翻阅到文章底部 总目录 01.hadoop100集全 02.大数据_HBase视

掌握这套大数据开发学习路线,从小白到精通没有问题!

很多人都知道大数据很火,就业很好,薪资很高,想往大数据方向发展.但该学哪些技术,学习路线是什么样的呢?用不用参加大数据培训呢?如果自己很迷茫.关注作者:需要更好的学习大数据,可以加我QQ群 首先先问自己几个问题,你的专业是什么,你擅长什么,对于计算机/软件,你的兴趣是什么?是计算机专业,对操作系统.硬件.网络.服务器感兴趣?是软件专业,对软件开发.编程.写代码感兴趣?还是数学.统计学专业,对数据和数字特别感兴趣. 其实这就是想告诉你的大数据的三个发展方向,平台搭建/优化/运维/监控.大数据开发/

这些大数据Hadoop面试题你有遇到过吗?你是怎么解决的!

(一)海量日志数据,提取出某日访问百度次数最多的那个IP. 首先是这一天,并且是访问百度的日志中的IP取出来,逐个写入到一个大文件中.注意到IP是32位的,最多有个2^32个IP.同样可以采用映射的方法, 比如模1000,把整个大文件映射为1000个小文件,再找出每个小文中出现频率最大的IP(可以采用hash_map进行频率统计,然后再找出频率最大 的几个)及相应的频率.然后再在这1000个最大的IP中,找出那个频率最大的IP,即为所求. 算法思想:分而治之+Hash IP地址最多有2^32=4