【免费咨询】 Cloudera Hadoop大数据培训:管理员、开发者、数据分析

北京、上海、广州、成都长期开班

【上海十一月底十二月初开班时间】

管理员:11月27日-11月30日

开发者:12月1日-12月4日

【免费咨询】15000519329(陈老师)

PS:也可免费索要一些Hadoop的入门资料

课程内容:

【Cloudera Apache Hadoop管理员课程】

课时:4天

学习系统管理的概念和Apache Hadoop的最佳实践,

从安装和配置到负载均衡和调优。

这个4天的的课程通过动手时间来赋予你部署的经验,

以及更多的安全方面的经验和故障排除。

课程结束后,学员被鼓励去参加Cloudera和Apache Hadoop管理员(CCAH)考试。

【课程内容】

1、Hadoop分布式文件系统(HDFS)

2、YARN/MapReduce的工作原理

3、如何优化Hadoop机群所需要的硬件配置

4、搭建Hadoop机群所需要考虑的网络因素

5、Hadoop机群维护和控制

6、如何利用Hadoop配置选项进行系统性能调优

7、如何利用FairScheduler为多用户提供服务级别保障

8、Hadoop机群维护和监控

9、如何使用Flume从动态生成的文件加载到Hadoop

10、如何使用Sqoop从关系型数据加载数据

11、Hadoop生态系统工具(如Hive、Impala、Pig和Base)

【学员基础】

具备基本Linux系统管理经验。不需要事先掌握Hadoop相关知识。

【授课形式】

案例教学+上机实践

【Cloudera Apache Hadoop程序员课程】

课时:4天

学习Hadoop分布式文件系统(HDFS)基础和MapReduce框架以及如何利用其API来编写程序,

讨论为更大型的工作流程而设计技术。

这门4天的课程涵盖了为MapReduce程序修复漏洞和优化性能所需的高级技巧。

程序员课程也引入了Apache生态项目比如Hive、Pig、HBase、Flume和Oozie。

在完成课程后,学员被鼓励参加Cloudera认证Apache Hadoop程序员(CCDH)考试。

【课程内容】

1、MapReduce与HDFS内核知识以及如何编写MapReduce程序

2、Hadoop开发的最佳实践,调试、实现工作流及通用算法

3、如何利用Hive、Pig、Sqoop、Flume、Oozie及其他Hadoop的组件

4、按需定制WritableComparables与InputFormats处理复杂的数据类型

5、利用MapReduce编写、执行连接操作以整合不同数据集合

6、用于现实世界数据分析所需的高级HadoopAPI主题

7、用Java写MapReduce程序,用Streaming写MapReduce程序

8、调试MapReduce代码的策略,利用localjobrunner在本地测试MapReduce代码

9、Partitioners和Reducers如何一起工作,定制化Partitioners

10、定制Writable和WritableComparable

11、用SequenceFile和Avro数据文件存储二进制数据

【学员基础】

该课程适合具有一定编程经验的程序开发人员。由于课程中需要完成Hadoop相关编程练习,熟悉Java者优先

【授课形式】

案例教学+上机实践

【Cloudera 数据分析课程】

课时:4天

针对任何需要在Hadoop上实时地通过SQL和熟悉的脚本来管理、操纵和查询大型复杂数据的人。

学习Apache Pig、Apache Hive和Cloudera Impala如何通过过滤联接和其他用户自定义的功能

来支持数据的转型和分析。

【课程内容】

1、Hadoop生态圈、实验场景介绍、用Hadoop工具导入数据

2、pig的特性、使用案例、和pig交互、pig Latin语法、Field定义、用pig执行ETL流程

3、pig处理复杂数据,复杂/nested嵌套的数据类型、用pig分析广告战役的数据

4、pig的多数据组操作,pig链接多数据组、用pig分析离散的数据组

5、用流处理和UDFs扩展pig,Macros和Imports、contributed functions,用其他语言和pig一起处理数据

6、pig故障排查和优化,用web界面排查一个故障的任务、Data采样和故障排查、理解执行计划、提高pig任务性能

7、hive表结构和数据储存、对比hive和传统数据库、hive vs.pig、hive使用案例

8、hive的关系数据分析、数据管理、文本处理、优化及扩展,在shell、脚本和hue上运行hive查询

9、impala和hive、pig、关系数据库的不同、使用impala shell

10、采样impala分析数据,过滤、排序and limiting results,提升impala性能,impala的交互式分析

11、对比map reduce、pig、hive、impala和关系数据库

【学员基础】

该课程适合有SQL经验和基本UNIX和Linux命令的数据分析师、业务分析师和管理员

事先无需Java和Apache Hadoop的经验

【授课形式】

案例教学+上机实践

时间: 2024-10-21 20:45:12

【免费咨询】 Cloudera Hadoop大数据培训:管理员、开发者、数据分析的相关文章

北京上海Cloudera Hadoop大数据培训:CCAH(管理员)、CCA(程序员)

北京上海Cloudera Hadoop大数据培训:CCAH(管理员).CCA(Spark and Hadoop) 北京9月27-30日Cloudera  Administrator Training for Apache Hadoop(CCAH) 上海9月27-30日Cloudera  Administrator Training for Apache Hadoop(CCAH) 北京10月17-20日Cloudera Data Analyst Training 上海10月27-30日Cloude

上海Cloudera Hadoop大数据培训:CCAH、CCP:DE

上海Cloudera Hadoop大数据培训:CCAH.CCP:DE 北京.上海.广州长期开班 3月上海开班时间:管理员(3月1-4日):开发者(3月23-26日) [其他课程安排请咨询]15000519329(陈老师) QQ群:Cloudera大数据 478790619 课程内容: [Cloudera Apache Hadoop管理员课程] 课时:4天 学习系统管理的概念和Apache Hadoop的最佳实践, 从安装和配置到负载均衡和调优. 这个4天的的课程通过动手时间来赋予你部署的经验,

12月上海Cloudera Hadoop大数据培训:CCAH、CCDH

北京.上海.广州.成都长期开班:南京.杭州.芜湖定期开班 12月上海开班时间:管理员周末班(12月12-13日:12月19-20日) 开发者脱产班(12月28-31日) [其他课程安排请咨询]15000519329(陈老师) 课程内容: [Cloudera Apache Hadoop管理员课程] 课时:4天 学习系统管理的概念和Apache Hadoop的最佳实践, 从安装和配置到负载均衡和调优. 这个4天的的课程通过动手时间来赋予你部署的经验, 以及更多的安全方面的经验和故障排除. 课程结束后

北京上海广州Cloudera Hadoop大数据:CCAH(管理员)、CCA(Spark and Hadoop)、HBase

上海5月21-24日ClouderaAaminisrrator Training for Apache Hadoop(CCAH) 广州6月1-3日Cloudera Trainingfor Apache Hbase 广州6月18-21日Cloudera Developertraining for Spark and Hadoop(CCA-175) 上海6月27-30日Cloudera Developertraining for Spark and Hadoop(CCA-175) 北京7月7-10日

《Cloudera hadoop大数据平台实战指南》此书预计2018年12月底上市

这本书由宋立桓老师和陈建平老师共同合作,本书的切入点明确而清晰,从Hadoop 生态明星 Cloudera 入手,单刀直入逐步引出各类大数据基础和核心应用框架. 全书系统介绍了大数据的相关知识,全书共十八章(宋立桓老师撰写第一章到第十二章.陈建平撰写第十三章到第十八章),从大数据概述.Cloudera hadoop平台的安装部署.并对大数据hadoop组件分别进行介绍,包括HDFS分布式文件系统.MapReduce计算框架.资源管理框架YARN .hive数据仓库.数据迁移工具Sqoop.分布式

Cloudera hadoop 大数据平台实战指南(1)

大数 据 主要 具有 四方 面的 典型 特征-- 规模 性( Volume). 多样性( Variety). 高速 性( Velocity) 和 价值 性( Value), 即 所谓 的" 4V". 大数据时代的关键技术:(1) 大数 据 采集 技术(2) 大 数据 预处理 技术(3) 大数 据 存储 及 管理 技术(4) 大数 据分析 及 挖掘 技术(5) 大 数据 可 视 化 展现 技术 什么是hadoop?Hadoop 最初 是 开 始于 2002 年的 Apache 的 Nut

Hadoop大数据视频教程_零基础实战培训(新增)

Hadoop大数据零基础高端实战培训系列配文本挖掘项目课程分类:大数据适合人群:初级课时数量:230课时+90课程更新程度:完成用到技术:部署Hadoop集群 涉及项目:京东商城.百度.阿里巴巴 咨询qq:1840215592 大数据Hadoop实战视频教程就从最基础的Java语法.数据库.Linux讲起到深入Hadoop大数据技术所必须的所有知识,设计Hadoop生态圈所有常用组件,包括但不限于:Greenplum数据库.HBase.Hive.Pig.ZooKeeper.Chukwa.Hado

Hadoop大数据零基础高端实战培训视频

<Hadoop大数据零基础高端实战培训系列配文本挖掘项目(七大亮点.十大目标)> 课程讲师:迪伦 课程分类:大数据 适合人群:初级 课时数量: 300课时 用到技术:部署Hadoop集群 涉及项目:京东商城.百度.阿里巴巴 咨询QQ:779591710 下载地址: 链接:http://pan.baidu.com/share/link?shareid=3299239734&uk=3289559542 密码:8tkb 第一阶段:Hadoop基础篇(50课时) - 千里之行,始于足下(赠送课

Hadoop大数据零基础高端实战培训(新增内容)

Hadoop大数据零基础高端实战培训系列配文本挖掘项目课程分类:大数据适合人群:初级课时数量:230课时+90课程更新程度:完成用到技术:部署Hadoop集群 涉及项目:京东商城.百度.阿里巴巴 咨询qq:1840215592 大数据Hadoop实战视频教程就从最基础的Java语法.数据库.Linux讲起到深入Hadoop大数据技术所必须的所有知识,设计Hadoop生态圈所有常用组件,包括但不限于:Greenplum数据库.HBase.Hive.Pig.ZooKeeper.Chukwa.Hado