第九届CDA考试状元访谈——LEVEL 2 大数据方向

第九届CDA数据分析师认证考试,在刚刚过去的2018年12月底圆满地落下了帷幕。

近日,我们采访了在本届考试中名列前茅的几位优秀学员,在上一篇中我们采访了Level 1 的状元,(点击查看上篇采访),本篇中采访了Level 2 大数据方向的前三甲,那么他们又是如何备考和学习的呢?

下面让我们来一睹他们的风采吧!

Level 2 大数据 · 状元 

胡仁飞

2009年毕业于浙江大学,之后一直在通信行业从事相关工作,先后担任过工程项目管理 、无线网络优化管理、经营分析师等。

1. 目前从事的工作

目前在浙江移动从事大数据建模与经营分析的工作。日常的工作均是与数据打交道,通过各类业务数据的分析,了解企业业务状况,并根据实际业务需求建立各类数据模型,支撑企业的业务发展。

2. 报考CDA认证考试的契机

虽然从事着大数据分析相关的工作,但我感觉自己对大数据平台涉及的各类技术、框架的理解与掌握还有待提升。CDA在业内的认可度较高,认证考试涉及的知识点也较多,因此我想通过报考CDA认证,给自己充电,提升自身的技术能力与业务能力。

3. 我是如何备考的

我在18年上半年其实就想报考了,但一直因为工作较忙就耽搁了。大概在10月中下旬左右,我终于下决心报考二级的大数据分析师,然后开始在官网上下载大纲,根据大纲及其他建议购买推荐教材,差不多10月底左右正式开始复习,实际备考差不多两个月。

因为备考时间相对紧张,而日常的工作也较忙,家庭生活也有较多琐碎事情,所以基本上每日都只能尽量安排出相对空闲的时间段进行复习。我一般会在工作午休的时候复习半个到一个小时,晚上下班后尽量复习1-2个小时。重点是在周末,可能会花相对较多的时间进行学习。总共差不多8周时间,我花了大概5周时间结合大纲进行教材的学习,包括上面提到的大数据技术基础与Spark大数据分析,还有Mahout及其他一些零散材料。接下来花了近2周时间复习考试辅导手册。考前最后1、2周则是对照大纲进行查漏补缺。

4. 推荐的书籍和课程

通过此次考试的复习,我发现了两本非常好的书,一本是厦门大学林子雨教授整理编写的《大数据技术基础》。

这本书以通俗浅显的语言较为全面及系统的讲解了大数据技术的基础知识。通过这本书,可以较好的掌握hadoop生态下的各类关键技术的原理与应用及他们之间的关系,如HDFS、MapReduce、Hbase等等。

第二本则是经管之家编写的《Spark大数据分析技术与实战》,这本书对spark做了详细的讲解,从安装部署到实际的编程应用均有涉及,通过这本书的学习,能对Spark项目以及主要的核心组件有较好的理解与掌握。

5. 给备考者的建议

在复习过程中,我觉得有两点比较重要:

1、除了重点复习考纲中的知识点,如果时间允许,一定要好好看书,从头到尾的有系统的看,这样知识点才能融会贯通。

2、一定要动手实操,从安装虚拟机、到搭建部署Hadoop、Hbase、Hive、Spark等平台与组件,再到具体的编程操作,如对数据库的操作、Spark几大组件的操作等等。

6. 今后的职业发展规划

今后我还是会继续从事大数据相关的工作,处理更多的数据,做更多的分析,建更多的模型。

Level 2 大数据 · 榜眼

滕云

现任桂林电信云与物联网运营总监,负责云计算、物联网等新兴业务的技术支撑。拥有10余年技术支撑和技术管理相关经验。

1. 目前从事的工作

现任桂林电信云与物联网运营总监,负责云计算、物联网等新兴业务的技术支撑。

2. 报考CDA认证考试的契机

电信作为综合信息服务提供商,具有应用大数据、人工智能技术的巨大空间和潜力,同时在数据量、算力、应用场景也有着三大天然优势。但作为传统企业,我们熟悉大数据的人才比较匮乏,还没有很好地实现大数据规模变现。自己希望能够通过系统的学习大数据,提升团队能力,带动大数据应用在公司内外部的落地。

作为工作族,我没有太多的学习时间,想通过考试来督促自己有计划地、系统地的学习。目前大数据方面并没有国家统一的考试认证,而CDA的课程体系比较成熟,在业界口碑也不错,因此报名参加了CDA考试。

3. 我是如何备考的

备考是过完国庆节开始准备的,整个备考花了近3个月左右,其中有近一个月是在搭建运行环境。

第一阶段 准备(5天)

分析大纲内容,根据教材编排的层次、自己对各个模块内容的熟悉程度、占比权重合理的制定学习计划,将学习目标分解到每一天,通过思维导图构建自己的知识框架体系。

比如linux、python、mysql这些我有基础,就没列入学习计划;spark占比是35%,权重最高,这也是我重点花时间学习的部分。

第二阶段 学习(40天)

对照大纲,根据参考书完整学习一遍,参考书上没有的知识点,通过查找网上资源补齐。

第三阶段 实践(25天)

按照大纲的知识结构,通过网上资源,安装了三套ubuntu系统的虚拟机,将java、python、Mysql,Hadoop、Zookeeper、Hive,Hbase,Spark等都进行了安装配置,Spark 各组件的编程也结合案例进行了实践。这些大数据软件安装过程中的坑比较多,花了不少时间。

第四阶段 差缺补漏(15天)

进行一些模拟题的练习,检验成效、查漏补缺,对遗忘的知识点重新复习。

每天的时间安排

早上6:00-7:00: 学习1-1.5小时,这是每天固定的、精力最充沛,不受打扰的时间段,我会重点看那些有一定难度或扩展性的内容。

下班后陪孩子做作业时间,,学习0.5-1小时。这个时间段一般会用来看一些零碎的知识点。

10:30-11:30:孩子睡觉后,学习1小时。

基本上每天保证2-3个小时。

4. 推荐的书籍和课程

备考还是以大纲和备考手册为主,结合大纲查阅网上资源;

参考书目中重点看了[5]经管之家,董轶群. 《Spark 大数据分析技术与实战》 ;

另外结合大纲可以看看《Hadoop权威指南第四版》清华大学出版社。

5. 给备考者的建议

如果仅仅以通过考试拿到证书为目的,备考时间没那么充裕,那么围绕大纲和备考手册就差不多了。

CDA II 大数据考试还是更偏重基础理论一些,如果是要提升自己的竞争力,要想将所学知识运用到实际工作中,建议根据大纲的框架,多实操多练习,加深对原理的理解和记忆,提升自己的真才实学。

6. 今后的职业发展规划

希望自己能继续尝试LEVEL 3大数据科学家的学习,在大数据和人工智能领域能够更加深入的去钻研,提升竞争力。通过机器学习、深度学习等技术,充分挖掘电信运营商拥有的海量数据的潜在价值,在网络运营、精准营销、智能客服等领域,提高用户的业务体验,降低运营成本,为企业转型发展提供有力的支撑。

Level 2 大数据 · 探花

冯卓基 

2010年毕业于广东工业大学,统计学专业。毕业后一直在广州工作。四年的数据分析经验。

1. 目前从事的工作

目前在彩讯科技股份有限公司工作,做中移统一认证项目。担任SIM盾数据分析师。由于SIM盾只有我一个数据分析师,所以很多事情需要自己处理和钻研。

2. 报考CDA认证考试的契机

数据分析这个行业目前很受欢迎。但现在中国并没有国家统一的考试,而CDA被我在职的公司认可,所以我选择报考CDA认证。

作为数据分析师,对大数据工具有一定的理解和使用经验。但对于Hadoop和Spark的底层架构,并没有太多的了解。通过这次CDA考试,把这些原理和架构都熟悉了一遍。有助于日后,工作的开展。

3. 推荐的书籍和课程

因为大数据很多工具都是Java写的,建议多了解Java。涉及Hadoop和Spark的可以上网看视频。

我很多的知识点都是通过网上的视频了解的。看视频有一定的好处,相比自己学习,看视频能轻松掌握部分知识。有老师的讲解,比较容易理解知识点。

4. 考试中有哪些知识难点

目前Python的正则表达式,Hadoop的工作原理,Spark的工作原理都是比较难的。针对较难的知识点,关于Python的正则表达式,还是要多用。尽管分值不大。但在实际的工作中也经常会用到的。因此还是多了解,多用正则表达式。另外对于Hadoop的工作原理。要有较系统的学习。千万别用零散的时间去学习难点。这样很容易忘记。学习效率也很低。针对上述知识点要尽量一次性学习。明白前后关联。有些工作原理还是需要记下来。当知识点出现模糊的时候,最好就是回归考试手册,看多一篇,就可能通顺的理解了。

5. 给备考者的建议

建议最好2-3个月的学习时间。严格按照考纲进行学习。在允许的情况下,可以自己搭建Hadoop和Spark 进行实践。要谨记Linux命令(工作中也常用)。真的考纲,可以适当的百度或是通过其他途径扩展一下知识点。

对于SQL,Linux,Hadoop,我个人是工作中使用比较多,而且自己也手动搭建过Hadoop,对里面的参数和架构还是有一定的了解。这些经历对考试也有一定的帮助。

另外如果遇到不懂的问题,要及时沟通,可以是同事、同学等。要懂得适当的利用一些身边的资源。

一句话,放好心态,多学习。积极面对每天的工作。每天能感觉到自己的进步就是对的了。

6. 今后的职业发展与规划

作为统计学的学生,我当然希望自己能继续从事数据分析的方向。同样的希望能继续从事大数据的工作。同时增加Python建模的工作经验。

第十届考试报名已开启,

考试时间为2019年6月29-30日

欢迎报考!

考试报名通道

http://exam.cda.cn/?seo

原文地址:https://www.cnblogs.com/CDA-JG/p/10313962.html

时间: 2024-08-28 12:37:37

第九届CDA考试状元访谈——LEVEL 2 大数据方向的相关文章

第九届CDA考试状元访谈,看看状元们都说了啥

第九届CDA数据分析师认证考试在2018年12月底圆满地落下了帷幕. 成绩已经揭晓(https://www.cda.cn/bigdata/26446.html),崭新的证书大抵都抵达每位通过考试的持证人手中啦! 近日,我们采访了在本届考试中名列前茅的几位优秀学员,并在本文中整理了他们的备考和学习经验,希望备考者们能够有所参考,并取得理想的成绩. 今天为大家带来的是CDA认证考试 Level 1 中成绩前六名的几位大神.其中四名并列状元,两位榜眼.下面让我们来一睹他们的风采吧! Level 1 状

你和高考状元之间隔了一个大数据的距离

最近网络被各省的高考状元们给刷屏了,都说高考是场全民的狂欢可一点儿没错.有高考的孩子,全家都"不得安宁",备考.考试.查成绩.志愿填报每一项都是"重大工程". 既然各省的高考状元都出来了,科多就放出来和大家一起看看,这是你心中学霸的样子吗? 左图为四川理科状元谢畅:右图为四川文科状元刘代蕾 贵州理科裸分状元周炜迪(右)和班主任:右图:贵州文科裸分状元林中文. 浙江理科状元张振宇:右图:浙江文科状元王至纯. 等一下,怎么听到无数心碎的声音?仿佛在说:童话故事里都是骗人

LinkedIn高级分析师王益:大数据时代的理想主义和现实主义(图灵访谈)

转自:http://www.ituring.com.cn/article/75445 王益,LinkedIn高级分析师.他曾在腾讯担任广告算法和策略的技术总监,在此期间他发明了并行机器学习系统“孔雀”,它可以从数十亿的用户行为或文本数据中学习到上百万的潜在主题,该系统被应用在腾讯可计算广告业务中.在此之前,他在Google担任软件工程师,并开发了一个分布式机器学习工具,这个工具让他获得了2008年的“Google APAC 创新奖”.王益曾在清华大学和香港城市大学学习,并取得了清华大学机器学习和

大数据现状和未来展望--百度大数据主任架构师马如悦访谈

导读:6 月 1 ~ 2 日,GIAC 全球互联网架构大会将于深圳举行.GIAC 是一个面向架构师.技术负责人及高端技术从业人员的技术架构大会.今年的 GIAC 已经有腾讯.阿里巴巴.百度.今日头条.科大讯飞.新浪微博.小米.美图.Oracle.链家.唯品会.京东.饿了么.美团点评.罗辑思维.ofo 等公司专家出席. 在大会前夕,高可用架构采访了本届 GIAC大数据分论坛 出品人马如悦,就目大家广泛关注的大数据方面的问题进行了访谈. 马如悦,百度大数据主任架构师,当前是百度大数据技术总负责人,百

[译]Stairway to Integration Services Level 4 - 更新数据

在本文中, 我们说下增量更新数据:即将数据源中更新了的数据替换掉目标表中对应的数据. 更新代码 操作之前我们先把目标表e (dbo.Contact). 的数据改掉 Use AdventureWorks go Update dbo.Contact Set MiddleName = 'Ray' Where MiddleName Is NULL 打开 My_First_SSIS_Project. 点击  Data Flow 标签. 我们把Level 3的项目文件修改下.双击 Lookup Transf

[教程]对拍程序(linux)+ 考试(做题)生成数据 + 提交注意事项

对拍程序(linux) 使用说明: ? ? ? 这里使用compare.cpp程序来对拍的,没有用bash脚本 ? ? ? 使用时,先编译4个文件(std中放正确的标程/暴力程序 my中自己的程序? rand是用来产生数据的) ? ? ? ? ? ? g++ compare.cpp -o duipai ? ? ? ? ? ? g++ my.cpp -o my ? ? ? ? ? ? g++ rand.cpp -o rand ? ? ? ? ? ? g++ std.cpp -o std ? 然后运

浪叫兽的自我介绍 (完整版) 讲述一段如何进入大数据行业

大家好,我是智浪淘沙,在大数据比赛的圈子里大家喜欢称呼我为浪叫兽. 我先做一个简单的且不如意的人生轨迹介绍把,出生农村的我,对自己的才智一直是很自信的.可能是由于自己的天性,不会表达自己加不会按部就班的喜欢上学习,我小学和初中都默默无闻,成绩也不怎么理想,但是始终好着面子,依然是觉得自己很聪明,自己以后能干些大事.而时常被考分的现实所打击.进入高中后,人开始长高了,人也帅气了一点点,玩心也大了,学了学校的美术,音乐,播音主持,体育的专业课,其中美术可能是一个星期,播音主持半学期,音乐半学期,体育

复旦大学数学学院转入大数据学院的14级同学对高等代数课程的评价

以下是复旦大学数学学院转入大数据学院的14级同学对本人的高等代数课程的评价. 14级  孙宇明同学 作为一名14级复旦大学数学科学学院转大数据方向的学生,我的本科前两年是在数院度过的,也因此十分幸运的选择了谢启鸿老师的高等代数课,作为我在代数方面的入门课.随着年级升高,谢老师在大一这一年教授的高代知识,在我本科,尤其是大数据这一领域的学习和应用中,发挥了越来越重要的作用,主要体现在以下两个方面: 一.扎实基础.基本的代数学是大数据研究过程中重要的知识基础(比如主成分分析.线性回归和预测.高维正态

浪叫兽的自我介绍(完整版)

此文已经有DF比赛平台约稿转载 写于2017年3月份大家好,我是智浪淘沙,在大数据比赛的圈子里大家喜欢称呼我为浪叫兽. 我先做一个简单的且不如意的人生轨迹介绍把,出生农村的我,对自己的才智一直是很自信的.可能是由于自己的天性,不会表达自己加不会按部就班的喜欢上学习,我小学和初中都默默无闻,成绩也不怎么理想,但是始终好着面子,依然是觉得自己很聪明,自己以后能干些大事.而时常被考分的现实所打击.进入高中后,人开始长高了,人也帅气了一点点,玩心也大了,学了学校的美术,音乐,播音主持,体育的专业课,其中