Greenplum Hadoop视频教程_Hadoop应用案例剖析

基于Greenplum Hadoop分布式平台的大数据解决方案及商业应用案例剖析
适合人群:高级
课时数量:96课时
用到技术:MapReduce、HDFS、Map-Reduce、Hive、Sqoop
涉及项目:Greenplum Hadoop大数据分析平台
联系qq:1840215592

Hadoop视频教程课程实战、实用、实际,总共 96 课时,系史上最全最深入的讲解Greenplum、Hadoop、云计算相关领域的技能课程,Hadoop视频教程适合于有一定java基础知识,对数据库和sql语句有一定了解,熟练使用linux系统的技术人员,特别适合于想换工作或寻求高薪职业的人士。

课程内容简介:
Hadoop视频教程分两大部分:
第一部分全面深入地介绍了Greenplum数据库,包括架构特性、部署、管理、开发和调优等,由浅入深,理论结合实战,让同学全面彻底掌握这把大数据利剑。
第二部分深入阐述了Hadoop的架构原理,Hadoop整体技术架构,包括HBase、Hive、Pig、ZooKeeper、Chukwa等实战运用。另外Hadoop视频教程还介绍了云计算的基础知识和Hadoop在云计算领域的运用,以及剖析了Hadoop在各个互联网巨头商业环境的运用。


学习课程目标:
课程结束时,帮助学员实现如下目标:
1、了解Greenplum和Hadoop的历史及目前发展的现状、以及它们的技术特点,从而把握分布式计算框架及未来发展方向,在大数据时代能为企业的技术选型及架构设计提供决策参考。
2、深入理解Greenplum的技术核心和管理操作,以此为基础,进而掌握MPP架构数据库的使用和调优的思想。
3、全面掌握Hadoop的架构原理和使用场景,并通过贯穿课程的项目进行实战锻炼,从而熟练使用Hadoop进行MapReduce程序开发。
4、深入理解Hadoop整体技术架构,包括HBase、Hive、Pig、ZooKeeper、Chukwa等,对Hadoop运作机制有清晰全面的认识,可以独立规划及部署生产环境的Hadoop集群,掌握Hadoop基本运维思路和方法,对Hadoop集群进行管理和优化。
5、理解什么是云计算和Hadoop在云计算领域的运用,以及理解Hadoop在各个互联网巨头商业环境的运用。

课程大纲:
第一部分 Greenplum 分布式数据库基础(41课时)
1 Greenplum架构
什么是Greenplum
Greenplum体系结构
Greenplum高可用性架构
2 安装Greenplum
配置环境
安装并初始化GPDB系统
启停数据库
配置GP系统
3 分布式数据库存储
数据是如何存储的
分布策略
4 GBDB查询处理
查询命令的执行
SQL查询处理机制
并行查询计划
5 角色权限及客户端认证管理
客户端认证
管理用户和组
6 客户端接口和程序
pgAdmin III
PSQL
7 定义数据库对象
创建并管理数据库
创建并管理表空间
创建并管理模式
创建并管理表
分区表
数据分布与分区
压缩存储与行列存储
序列、索引与视图
8 管理数据
插入、更新、删除记录
事务管理
空间回收和统计
9 查询数据
定义查询
使用函数和运算符
查询分析
10 工作负载及资源管理
GP工作负载管理概述
配置工作负载管理
创建资源队列
分配资源队列
检查资源队列状态
11 装载和卸载数据
GP装载命令概述
装载数据到GP
从GP卸载数据
格式化数据文件
12 备份恢复
串行备份和恢复
并行恢复和恢复
13 性能调优
如何进行调优
常见的性能问题
14 GP系统配置参数
关于GP的Master参数与本地化参数
设置配置参数
配置参数种类
15 开启高可用性
GP高可用概述
开启GP的Mirror
获知Segment何时失败
恢复失败的Segment
恢复失败的Master
16 GP MapReduce
MapReduce基础
GP MapReduce编程
MapReduce作业执行和故障诊断
第二部分 Hadoop分布式平台(55课时)
1 Hadoop的起源和体系
Hadoop思想起源:Google
Hadoop子项目家族
Hadoop的架构
2 Hadoop的安装与配置
准备和配置环境
三种运行模式
完全分布式模式安装
3 HDFS-大数据存储
HDFS概念与体系结构
HDFS的可靠性
HDFS文件操作
HDFS API
4 关于MapReduce
MapReduce编程模型
MapReduce的集群行为
MapReduce任务的优化
MapReduce工作机制
错误处理及作业调度机制
5 MapReduce应用开发
Hadoop Eclipse插件开发
数据筛选程序开发
倒排索引程序开发
6 Hadoop监控与管理
页面监控
hadoop备份
7 HBase数据库
Hbase体系结构
HBase shell
HBase API应用实例
HBase场景应用
HBase模式设计
8 Hive数据仓库
Hive组件与体系架构
Hive安装配置
Hive的服务接口
HiveQL常用操作
Hive的优化
Hive UDF编程
Hive综合实战
9 Pig数据分析平台
Pig框架
Pig安装配置
Pig的使用
Pig的数据模型
常用Pig Latin操作
Pig UDF编程
Pig数据分析实战
10 ZooKeeper分布式服务框架
ZooKeeper工作原理
ZooKeeper设计目标
ZooKeeper的数据结构和组成
ZooKeeper的安装配置
ZooKeeper命令行工具
ZooKeeper API
ZooKeeper实战:Hadoop任务调度
11 Chukwa集群监控系统
Chukwa的组成
Chukwa架构和设计
Chukwa安装与配置
常用Chukwa命令
实现自定义数据处理
12 Hadoop商业应用案例
云计算概念和特征
云计算服务模式和形态
Hadoop在云计算的运用
京东商城
百度
阿里巴巴
腾讯
13 Greenplum Hadoop集群
集成架构的特征
集成架构的优势
配置gphdfs协议使用环境
使用HDFS外部表
Hadoop视频教程详细查看:http://www.ibeifeng.com/goods-377.html

时间: 2024-11-12 15:56:04

Greenplum Hadoop视频教程_Hadoop应用案例剖析的相关文章

【教程分享】基于Greenplum Hadoop分布式平台的大数据解决方案及商业应用案例剖析

基于Greenplum Hadoop分布式平台的大数据解决方案及商业应用案例剖析 课程讲师:迪伦 课程分类:Java 适合人群:高级 课时数量:96课时 用到技术:MapReduce.HDFS.Map-Reduce.Hive.Sqoop 涉及项目:Greenplum Hadoop大数据分析平台 更新程度:完毕 对这个课程有兴趣的朋友可以加我的QQ2059055336和我联系 下载地址:链接:   pan.baidu.com/s/1nthYpKH 密码: niyi 随着云计算.大数据迅速发展,亟需

基于Greenplum Hadoop分布式平台的大数据解决方案及商业应用案例剖析

随着云计算.大数据迅速发展,亟需用hadoop解决大数据量高并发访问的瓶颈.谷歌.淘宝.百度.京东等底层都应用hadoop.越来越多的企 业急需引入hadoop技术人才.由于掌握Hadoop技术的开发人员并不多,直接导致了这几年hadoop技术的薪水远高于JavaEE及 Android程序员. Hadoop入门薪资已经达到了 8K 以上,工作1年可达到 1.2W 以上,具有2-3年工作经验的hadoop人才年薪可以达到 30万—50万 . 一般需要大数据处理的公司基本上都是大公司,所以学习had

Greenplum Hadoop分布式平台大数据解决方案实战教程

基于Greenplum Hadoop分布式平台的大数据解决方案及商业应用案例剖析 [上集]百度网盘下载:链接:http://pan.baidu.com/s/1eQJFXZ0 密码:kdx9 [下集]百度网盘下载:链接:http://pan.baidu.com/s/1hq4cO2w密码:cnsq 课程内容简介: 本课程分两大部分: 第一部分全面深入地介绍了Greenplum数据库,包括架构特性.部署.管理.开发和调优等,由浅入深 ,理论结合实战,让同学全面彻底掌握这把大数据利剑. 第二部分深入阐述

以用户为中心的前端设计案例剖析

WEB前端设计的最终目标是打造用户喜爱的产品,属于产品设计的范畴.所以一切设计要以用户为出发点,追求最佳的用户体验. 一.banner的设计 在WEB项目设计中,我们经常会有banner设计需求,一般而言首屏Banner及其相关区域也是整个网页设计中非常重要的部分. 优化前: 优化后: 优化前: 1.优化前网页首屏图片自动切换交互方式之外,用户可以点击圆点按钮手动切换图片.但考虑到图片本身的展示空间和效果,圆点按钮设计的比较小,造成用户点击该按钮时不方便. 2.banner切换图片时,会存在图片

ENode 2.0 第一个真实案例剖析-一个简易论坛(Forum)

前言 经过不断的坚持和努力,ENode 2.0的第一个真实案例终于出来了.这个案例是一个简易的论坛,开发这个论坛的初衷是为了验证用ENode框架来开发一个真实项目的可行性.关于ENode是什么,本文就不多介绍了,可以参考这篇文章的介绍.本文重点介绍一下ENode是如何帮助我们开发一个基于DDD+CQRS+Event Sourcing架构的应用程序的.这个论坛使用到了ENode, EQueue两个框架,EQueue是一个分布式的消息队列组件,该组件的主体思想是参考阿里的RocketMQ.当我们使用

知识图谱实战开发案例剖析(2)

一.前言 这是系列博文<知识图谱实战开发案例剖析>第1部分:知识图谱基础,第2节:知识图谱和人工智智能.该系列内容同时已经录制成视频课程,感兴趣的可以访问网易云课堂. 微信技术交流群: 作者:张子良,版权所有,转载请注明出处.QQ技术交流群:149933712. 二.正文 2.1 人工智能的业务架构 人工智能的业务架构 感知能力:听清: 认知能力:听懂: 服务能力:响应: 2.2 人工智能的技术架构 三大层:基础设施层.技术框架层.应用服务层: 2.3 人机对话系统业务模型 三.未完待续 系列

别具光芒 CSS网页布局案例剖析 中文pdf扫描版

别具光芒:CSS网页布局案例剖析以七大完整案例为线索,紧密围绕在使用CSS+DIV布局制作网页过程中遇到的实际需要和应该掌握的技术,全面介绍了CSS布局网页的各方面内容和技巧.书中摒弃了案例书常见的一味罗列步骤,轻视技术原理的做法,把案例作为学习手段,不但侧重讲解CSS盒子模型.标准流.浮动.定位等四大核心技术原理,更侧重讲解如何在实践中应用它们.读者通过案例,既可以掌握CSS的核心技术要点,也可以了解相关技术和工作流程,使读者不但知其然,还知其所以然.此外,本书还结合了流行的CMS内容管理系统

5、接口初始化规则和类加载、连接、初始化案例剖析

5.1.接口初始化规则 在了解接口的初始化规则前,先搞清类的初始化规则. 当java虚拟机初始化一个类时,会先初始化它的所有父类.但是这条规则并不适用于接口. 在初始化一个类时,并不会先初始化它所实现的接口: 在初始化一个接口时,并不会先初始化它的父接口: 使用一句话总结:实现类或者子接口的初始化并不会导致父接口的初始化. 只有当程序首次主动使用特定接口的静态变量(运行期常量)时,才会导致接口的初始化.这里需要注意的是接口中定义的变量都是常量,而常量又分为编译期常量和运行期常量,编译期常量的值在

MySQL 删除数据表语法以及案例剖析

MySQL 删除数据表 MySQL中删除数据表是非常容易操作的, 但是你再进行删除表操作时要非常小心,因为执行删除命令后所有数据都会消失. 语法 以下为删除MySQL数据表的通用语法: DROP TABLE table_name ; 在命令提示窗口中删除数据表 在mysql>命令提示窗口中删除数据表SQL语句为 DROP TABLE : 实例 以下实例删除了数据表runoob_tbl: [email protected]# mysql -u root -p Enter password:****