北京上海Cloudera Hadoop大数据培训:CCAH(管理员)、CCA(程序员)

北京上海Cloudera Hadoop大数据培训:CCAH(管理员)、CCA(Spark and Hadoop)

北京9月27-30日Cloudera  Administrator Training for Apache Hadoop(CCAH)

上海9月27-30日Cloudera  Administrator Training for Apache Hadoop(CCAH)

北京10月17-20日Cloudera Data Analyst Training

上海10月27-30日Cloudera Developer training for Spark and Hadoop(CCA-175)

【其他课程安排请咨询】400-679-6113

Cloudera大数据 478790619

课程内容:

【Cloudera Apache Hadoop管理员课程】

课时:4天

学习系统管理的概念和Apache Hadoop的最佳实践,

从安装和配置到负载均衡和调优。

这个4天的的课程通过动手时间来赋予你部署的经验,

以及更多的安全方面的经验和故障排除。

课程结束后,学员被鼓励去参加Cloudera和Apache Hadoop管理员(CCAH)考试。

【课程内容】

1、Hadoop分布式文件系统(HDFS)

2、YARN/MapReduce的工作原理

3、如何优化Hadoop机群所需要的硬件配置

4、搭建Hadoop机群所需要考虑的网络因素

5、Hadoop机群维护和控制

6、如何利用Hadoop配置选项进行系统性能调优

7、如何利用FairScheduler为多用户提供服务级别保障

8、Hadoop机群维护和监控

9、如何使用Flume从动态生成的文件加载到Hadoop

10、如何使用Sqoop从关系型数据加载数据

11、Hadoop生态系统工具(如Hive、Impala、Pig和Base)

【学员基础】

具备基本Linux系统管理经验。不需要事先掌握Hadoop相关知识。

【授课形式】

案例教学+上机实践

【Cloudera Apache Hadoop开发者课程】

课时:4天

【课程内容】

什么是Spark?

回顾:从Hadoop MapReduce到Spark

回顾:HDFS

回顾:YARN

spark概述

spark Shell的使用

RDDS(弹性分布式数据集)

Spark中的函数式编程

创建RDDs

其它通用RDD操作

键值对RDD(Pair RDDs)

Map-Reduce

其它键值对RDD(Pair RDDS)操作

Spark应用程序vs. Spark Shell

创建SparkContext

建立Spark应用程序(Scala和java)

运行Spark应用程序

Spark应用程序网页用户界面(Web UI)

配置Spark属性

日志记录

回顾:集群上的Spark

RDD分区

基于文件RDDs的分区

HDFS和数据本地性

执行并行操作

阶段和任务

RDD沿袭

RDD持久化概述

分布式持久化

Spark Streaming概述

实例:流请求计数

DStreams

开发Spark Streaming应用程序

多批处理操作

状态操作

滑动窗口操作

高级数据源

通用的Spark使用案例

Spark中的迭代算法

图处理与分析

机器学习

实例:K-means

共享变量:广播变量(Broadcast Variables)

共享变量:累加器(Accumulators)

常见性能问题

诊断性能问题

SparkSQL和SQL Context

创建DataFrames

DataFrames转化和查询

保存DataFrames

DataFrames和RDDS

SparkSQL,Impala和Hive-on-Spark的比较

【学员基础】

具备项目经验;熟悉Python与Scala;熟悉MySQL会有帮助

【授课形式】

案例教学+上机实践

时间: 2024-08-02 18:57:53

北京上海Cloudera Hadoop大数据培训:CCAH(管理员)、CCA(程序员)的相关文章

上海Cloudera Hadoop大数据培训:CCAH、CCP:DE

上海Cloudera Hadoop大数据培训:CCAH.CCP:DE 北京.上海.广州长期开班 3月上海开班时间:管理员(3月1-4日):开发者(3月23-26日) [其他课程安排请咨询]15000519329(陈老师) QQ群:Cloudera大数据 478790619 课程内容: [Cloudera Apache Hadoop管理员课程] 课时:4天 学习系统管理的概念和Apache Hadoop的最佳实践, 从安装和配置到负载均衡和调优. 这个4天的的课程通过动手时间来赋予你部署的经验,

北京上海广州Cloudera Hadoop大数据:CCAH(管理员)、CCA(Spark and Hadoop)、HBase

上海5月21-24日ClouderaAaminisrrator Training for Apache Hadoop(CCAH) 广州6月1-3日Cloudera Trainingfor Apache Hbase 广州6月18-21日Cloudera Developertraining for Spark and Hadoop(CCA-175) 上海6月27-30日Cloudera Developertraining for Spark and Hadoop(CCA-175) 北京7月7-10日

12月上海Cloudera Hadoop大数据培训:CCAH、CCDH

北京.上海.广州.成都长期开班:南京.杭州.芜湖定期开班 12月上海开班时间:管理员周末班(12月12-13日:12月19-20日) 开发者脱产班(12月28-31日) [其他课程安排请咨询]15000519329(陈老师) 课程内容: [Cloudera Apache Hadoop管理员课程] 课时:4天 学习系统管理的概念和Apache Hadoop的最佳实践, 从安装和配置到负载均衡和调优. 这个4天的的课程通过动手时间来赋予你部署的经验, 以及更多的安全方面的经验和故障排除. 课程结束后

【免费咨询】 Cloudera Hadoop大数据培训:管理员、开发者、数据分析

北京.上海.广州.成都长期开班 [上海十一月底十二月初开班时间] 管理员:11月27日-11月30日 开发者:12月1日-12月4日 [免费咨询]15000519329(陈老师) PS:也可免费索要一些Hadoop的入门资料 课程内容: [Cloudera Apache Hadoop管理员课程] 课时:4天 学习系统管理的概念和Apache Hadoop的最佳实践, 从安装和配置到负载均衡和调优. 这个4天的的课程通过动手时间来赋予你部署的经验, 以及更多的安全方面的经验和故障排除. 课程结束后

《Cloudera hadoop大数据平台实战指南》此书预计2018年12月底上市

这本书由宋立桓老师和陈建平老师共同合作,本书的切入点明确而清晰,从Hadoop 生态明星 Cloudera 入手,单刀直入逐步引出各类大数据基础和核心应用框架. 全书系统介绍了大数据的相关知识,全书共十八章(宋立桓老师撰写第一章到第十二章.陈建平撰写第十三章到第十八章),从大数据概述.Cloudera hadoop平台的安装部署.并对大数据hadoop组件分别进行介绍,包括HDFS分布式文件系统.MapReduce计算框架.资源管理框架YARN .hive数据仓库.数据迁移工具Sqoop.分布式

Cloudera hadoop 大数据平台实战指南(1)

大数 据 主要 具有 四方 面的 典型 特征-- 规模 性( Volume). 多样性( Variety). 高速 性( Velocity) 和 价值 性( Value), 即 所谓 的" 4V". 大数据时代的关键技术:(1) 大数 据 采集 技术(2) 大 数据 预处理 技术(3) 大数 据 存储 及 管理 技术(4) 大数 据分析 及 挖掘 技术(5) 大 数据 可 视 化 展现 技术 什么是hadoop?Hadoop 最初 是 开 始于 2002 年的 Apache 的 Nut

最新cloudera大数据培训班 ccah ccdh 数据分析师 数据科学家

上海2月21-24日Cloudera Developer training for Spark and Hadoop(CCA-175)北京2月23-26日Cloudera Developer training for Spark and Hadoop(CCA-175)上海2月27-3月2日Cloudera Administrator Training for Apache Hadoop(CCAH) 北京3月9-12日Cloudera Administrator Training for Apac

Hadoop大数据视频教程_零基础实战培训(新增)

Hadoop大数据零基础高端实战培训系列配文本挖掘项目课程分类:大数据适合人群:初级课时数量:230课时+90课程更新程度:完成用到技术:部署Hadoop集群 涉及项目:京东商城.百度.阿里巴巴 咨询qq:1840215592 大数据Hadoop实战视频教程就从最基础的Java语法.数据库.Linux讲起到深入Hadoop大数据技术所必须的所有知识,设计Hadoop生态圈所有常用组件,包括但不限于:Greenplum数据库.HBase.Hive.Pig.ZooKeeper.Chukwa.Hado

Hadoop大数据零基础高端实战培训视频

<Hadoop大数据零基础高端实战培训系列配文本挖掘项目(七大亮点.十大目标)> 课程讲师:迪伦 课程分类:大数据 适合人群:初级 课时数量: 300课时 用到技术:部署Hadoop集群 涉及项目:京东商城.百度.阿里巴巴 咨询QQ:779591710 下载地址: 链接:http://pan.baidu.com/share/link?shareid=3299239734&uk=3289559542 密码:8tkb 第一阶段:Hadoop基础篇(50课时) - 千里之行,始于足下(赠送课