Hadoop2.X大数据平台V3视频教程|Hadoop2视频教程

课程大纲:

第1周 Hadoop生态系统概述以及版本演化

概要介绍Hadoop生态系统及其版本演化历史,并给出hadoop版本选择建议。

第2周 HDFS 2.0 原理、特性与基本架构

介绍HDFS 2.0原理与架构,并与HDFS 1.0进行对比。介绍HDFS 2.0新特性,包括快照、缓存、异构存储架构等

第3周 YARN应用场景、基本架构与资源调度

介绍YARN是什么、基本原理与架构,并剖析其调度策略。

第4周 MapReduce 2.0基本原理与架构

介绍计算框架MapReduce基本原理与架构

第5周 MapReduce 2.0编程实践(涉及多语言编程)

手把手介绍如何用java、C++、php等语言编写MapReduce程序

第6周 HBase应用场景、原理与基本架构

介绍HBase应用场景、原理和架构

第7周 HBase编程实践(涉及多语言编程)

手把手介绍如何用Java、C++、Python等语言编写HBase客户端程序。

第8周 HBase案例分析

介绍几个HBase典型应用案例,包括互联网应用案例和银行应用案例。

第9周 Zookeeper部署及典型应用

介绍Zookeeper是什么,在hadoop生态系统中的地位

第10周 Hadoop数据入库系统Flume与Sqoop

介绍如何使用flume和sqoop两个系统将外部流式数据(比如网站日志,用户行为数据等)、关系型数据库(比如MySQL、Oracle等)中的数据导入Hadoop中进行分析和挖掘

第11周 数据分析系统Hive与Pig应用与比较

介绍如何使用hive和pig分析hadoop中的海量数据

第12周 数据挖掘工具包Mahout

介绍如何使用mahout提供的数据挖掘和机器学习算法进行海量数据挖掘

第13周 工作流引擎Oozie与Azkaban应用

介绍如何使用Oozie和azkaban对MapReduce作业、Pig/hive作业等进行统一管理和调度

第14周 两个综合案例:日志分析系统与机器学习平台

介绍两个典型的互联网应用案例,进一步深入领悟hadoop生态系统中各个系统的应用场景和解决实际问题的方式。

下载地址:http://pan.baidu.com/s/1qW4rPSg密码: 7ohd

时间: 2024-10-25 08:40:49

Hadoop2.X大数据平台V3视频教程|Hadoop2视频教程的相关文章

小象学院Hadoop 2.X大数据平台V3

课时1:培训须知第1 章 : Hadoop生态系统以及版本演化 课时2:课程视频 66:53 课时3:学习资料 课时4:第一讲 课后作业第2 章 : HDFS 2.0应用场景.原理.基本架构及使用方法 课时5:课程视频1-HDFS 2.0应用场景.原理.基本架构及使用方法 59:11 课时6:课程视频2-Hadoop 2.0理论基础-安装部署方法1 50:05 课时7:课程视频2-Hadoop 2.0理论基础-安装部署方法2 50:05 课时8:课程视频2-Hadoop 2.0 上机实践(部署单

中华石杉 Spark大型项目实战:电商用户行为分析大数据平台138讲视频教程(项目实战)

38套大数据,云计算,架构,数据分析师,Hadoop,Spark,Storm,Kafka,人工智能,机器学习,深度学习,项目实战视频教程 视频课程包含: 38套大数据和人工智能精品高级课包含:大数据,云计算,架构,数据挖掘实战,实时推荐系统实战,电视收视率项目实战,实时流统计项目实战,离线电商分析项目实战,Spark大型项目实战用户分析,智能客户系统项目实战,Linux基础,Hadoop,Spark,Storm,Docker,Mapreduce,Kafka,Flume,OpenStack,Hiv

ClouderaManager视频教程_ClouderaManager大数据平台视频教程

ClouderaManager视频教程_ClouderaManager大数据平台视频教程课程下载地址:https://pan.baidu.com/s/1Os8APg7dgXfsqp71SlUoYQ 提取码: bfqv 通过本课程的学习,可以掌握ClouderaManager的应用场景和使用规范,并可以学习到大型公司企业内部的大数据架构图.对大数据人员来讲,可以掌握企业级常用的Linux命令和快速安全的安装各类大数据组件及性能调优. Cloudera Manager是用于管理CDH群集的端到端应用

美团大数据平台架构实践

今天给大家介绍的内容主要包括以下四个部分首先是介绍一下美团大数据平台的架构,然后回顾一下历史,看整个平台演进的时间演进线,每一步是怎么做的,以及一些挑战和应对策略,最后总结一下,聊一聊我对平台化的看法. 谢语宸是来自美团的大数据构建平台的架构师.他在QCon2016北京站分享了一些整体上构建大数据平台的方法,除了聚焦在某一个点上的还有构建整体的大数据,以及各种各样技术的应用,希望能给大家一些关于大数据方面的启迪.   非常感谢给我这个机会给大家带来这个演讲,我是2011年加入美团,最开始负责统计

Spark大型项目实战:电商用户行为分析大数据平台

本项目主要讲解了一套应用于互联网电商企业中,使用Java.Spark等技术开发的大数据统计分析平台,对电商网站的各种用户行为(访问行为.页面跳转行为.购物行为.广告点击行为等)进行复杂的分析.用统计分析出来的数据,辅助公司中的PM(产品经理).数据分析师以及管理人员分析现有产品的情况,并根据用户行为分析结果持续改进产品的设计,以及调整公司的战略和业务.最终达到用大数据技术来帮助提升公司的业绩.营业额以及市场占有率的目标. 1.课程研发环境 开发工具: Eclipse Linux:CentOS 6

深入浅出解析大数据平台架构

目录: 什么是大数据 Hadoop介绍-HDFS.MR.Hbase 大数据平台应用举例-腾讯 公司的大数据平台架构 "就像望远镜让我们能够感受宇宙,显微镜让我们能够观测微生物一样,大数据正在改变我们的生活以及理解世界的方式--". 大数据的4V特征-来源 公司的"大数据" 随着公司业务的增长,大量和流程.规则相关的非结构化数据也爆发式增长.比如: 1.业务系统现在平均每天存储20万张图片,磁盘空间每天消耗100G: 2.平均每天产生签约视频文件6000个,每个平均2

多图技术贴:深入浅出解析大数据平台架构

目录: 什么是大数据 Hadoop介绍-HDFS.MR.Hbase 大数据平台应用举例-腾讯 公司的大数据平台架构 "就像望远镜让我们能够感受宇宙,显微镜让我们能够观测微生物一样,大数据正在改变我们的生活以及理解世界的方式--". 大数据的4V特征-来源 公司的"大数据" 随着公司业务的增长,大量和流程.规则相关的非结构化数据也爆发式增长.比如: 1.业务系统现在平均每天存储20万张图片,磁盘空间每天消耗100G: 2.平均每天产生签约视频文件6000个,每个平均2

大数据平台Hadoop的分布式集群环境搭建

1 概述 本文章介绍大数据平台Hadoop的分布式环境搭建.以下为Hadoop节点的部署图,将NameNode部署在master1,SecondaryNameNode部署在master2,slave1.slave2.slave3中分别部署一个DataNode节点 NN=NameNode(名称节点) SND=SecondaryNameNode(NameNode的辅助节点) DN=DataNode(数据节点)2 前期准备 (1)准备五台服务器 如:master1.master2.slave1.sla

ClouderaManager大数据平台教程

ClouderaManager大数据平台视频教程课程分享链接:https://pan.baidu.com/s/15QQ6kodiJ_mPqrUobnBSQQ 密码:winq Cloudera Manager是用于管理CDH群集的端到端应用程序.Cloudera Manager通过对CDH集群的每个部分提供细粒度的可视性和控制来设置企业部署的标准,使运营商能够提高性能,提高服务质量,提高合规性并降低管理成本. 使用Cloudera Manager,可以轻松部署和集中操作完整的CDH堆栈和其他托管服