第九届CDA数据分析师认证考试,在刚刚过去的2018年12月底圆满地落下了帷幕。
近日,我们采访了在本届考试中名列前茅的几位优秀学员,在上一篇中我们采访了Level 1 的状元,(点击查看上篇采访),本篇中采访了Level 2 大数据方向的前三甲,那么他们又是如何备考和学习的呢?
下面让我们来一睹他们的风采吧!
Level 2 大数据 · 状元
胡仁飞
2009年毕业于浙江大学,之后一直在通信行业从事相关工作,先后担任过工程项目管理 、无线网络优化管理、经营分析师等。
1. 目前从事的工作
目前在浙江移动从事大数据建模与经营分析的工作。日常的工作均是与数据打交道,通过各类业务数据的分析,了解企业业务状况,并根据实际业务需求建立各类数据模型,支撑企业的业务发展。
2. 报考CDA认证考试的契机
虽然从事着大数据分析相关的工作,但我感觉自己对大数据平台涉及的各类技术、框架的理解与掌握还有待提升。CDA在业内的认可度较高,认证考试涉及的知识点也较多,因此我想通过报考CDA认证,给自己充电,提升自身的技术能力与业务能力。
3. 我是如何备考的
我在18年上半年其实就想报考了,但一直因为工作较忙就耽搁了。大概在10月中下旬左右,我终于下决心报考二级的大数据分析师,然后开始在官网上下载大纲,根据大纲及其他建议购买推荐教材,差不多10月底左右正式开始复习,实际备考差不多两个月。
因为备考时间相对紧张,而日常的工作也较忙,家庭生活也有较多琐碎事情,所以基本上每日都只能尽量安排出相对空闲的时间段进行复习。我一般会在工作午休的时候复习半个到一个小时,晚上下班后尽量复习1-2个小时。重点是在周末,可能会花相对较多的时间进行学习。总共差不多8周时间,我花了大概5周时间结合大纲进行教材的学习,包括上面提到的大数据技术基础与Spark大数据分析,还有Mahout及其他一些零散材料。接下来花了近2周时间复习考试辅导手册。考前最后1、2周则是对照大纲进行查漏补缺。
4. 推荐的书籍和课程
通过此次考试的复习,我发现了两本非常好的书,一本是厦门大学林子雨教授整理编写的《大数据技术基础》。
这本书以通俗浅显的语言较为全面及系统的讲解了大数据技术的基础知识。通过这本书,可以较好的掌握hadoop生态下的各类关键技术的原理与应用及他们之间的关系,如HDFS、MapReduce、Hbase等等。
第二本则是经管之家编写的《Spark大数据分析技术与实战》,这本书对spark做了详细的讲解,从安装部署到实际的编程应用均有涉及,通过这本书的学习,能对Spark项目以及主要的核心组件有较好的理解与掌握。
5. 给备考者的建议
在复习过程中,我觉得有两点比较重要:
1、除了重点复习考纲中的知识点,如果时间允许,一定要好好看书,从头到尾的有系统的看,这样知识点才能融会贯通。
2、一定要动手实操,从安装虚拟机、到搭建部署Hadoop、Hbase、Hive、Spark等平台与组件,再到具体的编程操作,如对数据库的操作、Spark几大组件的操作等等。
6. 今后的职业发展规划
今后我还是会继续从事大数据相关的工作,处理更多的数据,做更多的分析,建更多的模型。
Level 2 大数据 · 榜眼
滕云
现任桂林电信云与物联网运营总监,负责云计算、物联网等新兴业务的技术支撑。拥有10余年技术支撑和技术管理相关经验。
1. 目前从事的工作
现任桂林电信云与物联网运营总监,负责云计算、物联网等新兴业务的技术支撑。
2. 报考CDA认证考试的契机
电信作为综合信息服务提供商,具有应用大数据、人工智能技术的巨大空间和潜力,同时在数据量、算力、应用场景也有着三大天然优势。但作为传统企业,我们熟悉大数据的人才比较匮乏,还没有很好地实现大数据规模变现。自己希望能够通过系统的学习大数据,提升团队能力,带动大数据应用在公司内外部的落地。
作为工作族,我没有太多的学习时间,想通过考试来督促自己有计划地、系统地的学习。目前大数据方面并没有国家统一的考试认证,而CDA的课程体系比较成熟,在业界口碑也不错,因此报名参加了CDA考试。
3. 我是如何备考的
备考是过完国庆节开始准备的,整个备考花了近3个月左右,其中有近一个月是在搭建运行环境。
第一阶段 准备(5天)
分析大纲内容,根据教材编排的层次、自己对各个模块内容的熟悉程度、占比权重合理的制定学习计划,将学习目标分解到每一天,通过思维导图构建自己的知识框架体系。
比如linux、python、mysql这些我有基础,就没列入学习计划;spark占比是35%,权重最高,这也是我重点花时间学习的部分。
第二阶段 学习(40天)
对照大纲,根据参考书完整学习一遍,参考书上没有的知识点,通过查找网上资源补齐。
第三阶段 实践(25天)
按照大纲的知识结构,通过网上资源,安装了三套ubuntu系统的虚拟机,将java、python、Mysql,Hadoop、Zookeeper、Hive,Hbase,Spark等都进行了安装配置,Spark 各组件的编程也结合案例进行了实践。这些大数据软件安装过程中的坑比较多,花了不少时间。
第四阶段 差缺补漏(15天)
进行一些模拟题的练习,检验成效、查漏补缺,对遗忘的知识点重新复习。
每天的时间安排
早上6:00-7:00: 学习1-1.5小时,这是每天固定的、精力最充沛,不受打扰的时间段,我会重点看那些有一定难度或扩展性的内容。
下班后陪孩子做作业时间,,学习0.5-1小时。这个时间段一般会用来看一些零碎的知识点。
10:30-11:30:孩子睡觉后,学习1小时。
基本上每天保证2-3个小时。
4. 推荐的书籍和课程
备考还是以大纲和备考手册为主,结合大纲查阅网上资源;
参考书目中重点看了[5]经管之家,董轶群. 《Spark 大数据分析技术与实战》 ;
另外结合大纲可以看看《Hadoop权威指南第四版》清华大学出版社。
5. 给备考者的建议
如果仅仅以通过考试拿到证书为目的,备考时间没那么充裕,那么围绕大纲和备考手册就差不多了。
CDA II 大数据考试还是更偏重基础理论一些,如果是要提升自己的竞争力,要想将所学知识运用到实际工作中,建议根据大纲的框架,多实操多练习,加深对原理的理解和记忆,提升自己的真才实学。
6. 今后的职业发展规划
希望自己能继续尝试LEVEL 3大数据科学家的学习,在大数据和人工智能领域能够更加深入的去钻研,提升竞争力。通过机器学习、深度学习等技术,充分挖掘电信运营商拥有的海量数据的潜在价值,在网络运营、精准营销、智能客服等领域,提高用户的业务体验,降低运营成本,为企业转型发展提供有力的支撑。
Level 2 大数据 · 探花
冯卓基
2010年毕业于广东工业大学,统计学专业。毕业后一直在广州工作。四年的数据分析经验。
1. 目前从事的工作
目前在彩讯科技股份有限公司工作,做中移统一认证项目。担任SIM盾数据分析师。由于SIM盾只有我一个数据分析师,所以很多事情需要自己处理和钻研。
2. 报考CDA认证考试的契机
数据分析这个行业目前很受欢迎。但现在中国并没有国家统一的考试,而CDA被我在职的公司认可,所以我选择报考CDA认证。
作为数据分析师,对大数据工具有一定的理解和使用经验。但对于Hadoop和Spark的底层架构,并没有太多的了解。通过这次CDA考试,把这些原理和架构都熟悉了一遍。有助于日后,工作的开展。
3. 推荐的书籍和课程
因为大数据很多工具都是Java写的,建议多了解Java。涉及Hadoop和Spark的可以上网看视频。
我很多的知识点都是通过网上的视频了解的。看视频有一定的好处,相比自己学习,看视频能轻松掌握部分知识。有老师的讲解,比较容易理解知识点。
4. 考试中有哪些知识难点
目前Python的正则表达式,Hadoop的工作原理,Spark的工作原理都是比较难的。针对较难的知识点,关于Python的正则表达式,还是要多用。尽管分值不大。但在实际的工作中也经常会用到的。因此还是多了解,多用正则表达式。另外对于Hadoop的工作原理。要有较系统的学习。千万别用零散的时间去学习难点。这样很容易忘记。学习效率也很低。针对上述知识点要尽量一次性学习。明白前后关联。有些工作原理还是需要记下来。当知识点出现模糊的时候,最好就是回归考试手册,看多一篇,就可能通顺的理解了。
5. 给备考者的建议
建议最好2-3个月的学习时间。严格按照考纲进行学习。在允许的情况下,可以自己搭建Hadoop和Spark 进行实践。要谨记Linux命令(工作中也常用)。真的考纲,可以适当的百度或是通过其他途径扩展一下知识点。
对于SQL,Linux,Hadoop,我个人是工作中使用比较多,而且自己也手动搭建过Hadoop,对里面的参数和架构还是有一定的了解。这些经历对考试也有一定的帮助。
另外如果遇到不懂的问题,要及时沟通,可以是同事、同学等。要懂得适当的利用一些身边的资源。
一句话,放好心态,多学习。积极面对每天的工作。每天能感觉到自己的进步就是对的了。
6. 今后的职业发展与规划
作为统计学的学生,我当然希望自己能继续从事数据分析的方向。同样的希望能继续从事大数据的工作。同时增加Python建模的工作经验。
第十届考试报名已开启,
考试时间为2019年6月29-30日
欢迎报考!
考试报名通道
http://exam.cda.cn/?seo
原文地址:https://www.cnblogs.com/CDA-JG/p/10313962.html