小象学院Hadoop 2.X大数据平台V3

课时1:培训须知
第1 章 : Hadoop生态系统以及版本演化
课时2:课程视频 66:53
课时3:学习资料
课时4:第一讲 课后作业
第2 章 : HDFS 2.0应用场景、原理、基本架构及使用方法
课时5:课程视频1-HDFS 2.0应用场景、原理、基本架构及使用方法 59:11
课时6:课程视频2-Hadoop 2.0理论基础—安装部署方法1 50:05
课时7:课程视频2-Hadoop 2.0理论基础—安装部署方法2 50:05
课时8:课程视频2-Hadoop 2.0 上机实践(部署单机HDFS+YARN) 21:02
课时9:视频课程2-Hadoop 2.0 上机实践(部署多机-HDFS HA+YARN) 25:09
课时10:课程视频2-Hadoop 2.0 上机实践(部署多机-HDFS HA+Federation-YARN) 38:34
课时11:视频课程3-Hadoop2.0 Shell命令使用 12:15
课时12:课程视频4-Hadoop_Clusters_and_the_Network 23:34
课时13:学习资料
课时14:第2讲 课后作业
第3 章 : YARN应用场景、基本架构与资源调度
课时15:课程视频 60:44
课时16:学习资料
课时17:第3讲 课后作业
第4 章 : MapReduce 2.0基本原理与架构
课时18:课程视频 59:30
课时19:学习资料
课时20:第4讲 课后作业
第5 章 : MapReduce 2.0编程实践(涉及多语言编程)
课时21:课程视频1—理论部分 62:21
课时22:课程视频2—实践部分 30:17
课时23:学习资料
课时24:第5讲 课后作业
第6 章 : HBase应用场景、原理与基本架构
课时25:课程视频 72:30
课时26:学习资料
课时27:第6讲 课后作业
第7 章 : HBase编程实践(涉及多语言编程)
课时28:课程视频 70:58
课时29:学习资料
课时30:第7讲 课后作业
第8 章 : HBase案例分析
课时31:课程视频 59:00
课时32:学习资料
课时33:第8讲 课后作业
第9 章 : Zookeeper部署及典型应用
课时34:课程视频 55:05
课时35:学习资料
课时36:第9讲 课后作业
第10 章 : Hadoop数据入库系统Flume与Sqoop
课时37:课程视频 51:07
课时38:学习资料
课时39:第10讲 课后作业
第11 章 : 数据分析系统Hive与Pig应用与比较
课时40:[课程视频]数据分析系统pig 39:05
课时41:[课程视频]数据分析系统Hive 62:31
课时42:学习资料
课时43:第11讲 课后作业
第12 章 : 数据挖掘工具包Mahout
课时44:课程视频 75:00
课时45:学习资料
课时46:第12讲 课后作业
第13 章 : 工作流引擎Oozie与Azkaban应用
课时47:oozie与azkaban视频(更新) 42:51
课时48:学习资料
课时49:第13讲 课后作业
第14 章 : 两个综合案例:日志分析系统与机器学习平台
课时50:课程视频 45:28
课时51:学习资料
课时52:第14讲 课后作业

下载链接:http://www.itsource.com.cn/thread-230-1-1.html

时间: 2024-11-09 18:06:26

小象学院Hadoop 2.X大数据平台V3的相关文章

Hadoop集群大数据平台搭建

Hadoop集群环境搭建配置 前言 Hadoop的搭建分为三种形式:单机模式.伪分布模式.完全分布模式,只要掌握了完全分布模式,也就是集群模式的搭建,剩下的两种模式自然而然就会用了,一般前两种模式一般用在开发或测试环境下,Hadoop最大的优势就是分布式集群计算,所以在生产环境下都是搭建的最后一种模式:完全分布模式. 硬件选择 须知: 分布式环境中一个服务器就是一个节点 节点越多带来的是集群性能的提升 一个Hadoop集群环境中,NameNode,SecondaryNameNode和DataNo

Hadoop2.X大数据平台V3视频教程|Hadoop2视频教程

课程大纲: 第1周 Hadoop生态系统概述以及版本演化 概要介绍Hadoop生态系统及其版本演化历史,并给出hadoop版本选择建议. 第2周 HDFS 2.0 原理.特性与基本架构 介绍HDFS 2.0原理与架构,并与HDFS 1.0进行对比.介绍HDFS 2.0新特性,包括快照.缓存.异构存储架构等 第3周 YARN应用场景.基本架构与资源调度 介绍YARN是什么.基本原理与架构,并剖析其调度策略. 第4周 MapReduce 2.0基本原理与架构 介绍计算框架MapReduce基本原理与

大数据知识点分享:大数据平台应用 17 个知识点汇总

一.大数据中的数据仓库和Mpp数据库如何选型? 在Hadoop平台中,一般大家都把hive当做数据仓库的一种选择,而Mpp数据库的典型代表就是impala,presto.Mpp架构的数据库主要用于即席查询场景,暨对数据查询效率有较高要求的场景,而对数据仓库的查询效率要求无法做大MPP那样,所以更多地适用与离线分析场景. Hadoop已经是大数据平台的实时标准,其中Hadoop生态中有数据仓库Hive,可以作为大数据平台的标准数据仓库, 对于面向应用的MPP数据库,可以选择MYCAT(mySql的

hadoop job解决大数据量关联时数据倾斜的一种办法

转自:http://www.cnblogs.com/xuxm2007/archive/2011/09/01/2161929.html http://www.geminikwok.com/2011/04/02/hadoop-job解å?³å¤§æ?°æ?®é??å?³è??æ—¶æ?°æ?®å?¾æ??ç??ä¸?ç§?å??æ³?/ 数据倾斜是指,map /reduce程序执行时,reduce节点大部分执行完毕,但是有一个或者几个reduce节点运行很慢,导致整个程序的处理时间很长,这是因为

大数据是什么?华为云学院带你探索大数据之旅

大数据是什么?华为云学院带你探索大数据之旅我们首先从大数据是什么开始讲起,!下面由我来带领大家!展开我们本次的大数据学习之旅!大数据是什么,内容将包括大数据的产生,发展大数据的基本概念.首先我们来追溯一下大数据的产生与发展,大数据的产生和发展主要经历了三个阶段. 第一个阶段,我们称为是萌芽期!自上世纪九十年代至本世纪初,随着数据挖掘理论和数据库技术的逐步成熟,一批商业智能工具和知识的管理技术也开始得到应用,比如数据仓库,专家系统知识管理系统等等.第二阶段我们称为是成熟期.本世纪的前十年Web2.

大数据平台Hadoop的分布式集群环境搭建

1 概述 本文章介绍大数据平台Hadoop的分布式环境搭建.以下为Hadoop节点的部署图,将NameNode部署在master1,SecondaryNameNode部署在master2,slave1.slave2.slave3中分别部署一个DataNode节点 NN=NameNode(名称节点) SND=SecondaryNameNode(NameNode的辅助节点) DN=DataNode(数据节点)2 前期准备 (1)准备五台服务器 如:master1.master2.slave1.sla

ambari 搭建hadoop大数据平台系列4-配置ambari-server

ambari 搭建hadoop大数据平台系列4-配置ambari-server,分为三部分: 官网:  https://docs.hortonworks.com/HDPDocuments/Ambari-2.4.2.0/bk_ambari-installation/content/download_the_ambari_repo_lnx7.html 安装ambari-server  配置ambari-server  命令;ambari-server setup 启动ambari-server 命令

ambari 搭建hadoop大数据平台系列1-概述

最近要为第三方搭建一套大数据平台,中间先进行了虚拟机版本,测试通过后,进行了物理机版本的生产环境,网上关于ambari 的文章并不多,但好在ambari 官方文档质量略高,社区比较活跃,便整理该系列的文档,将埋掉的坑抛出来,帮助小伙伴们更加快速的搭建自己的hadoop 平台. 分三个部分: 1. 为什么选择ambari 来搭建 说到ambari, 主要的对手cloudrea manager ,大家比较熟悉,至于各自长短,优势劣汰,大家自己斟酌选择啦. Cloudera Manager is di

数据仓库和Hadoop大数据平台有什么差别?

广义上来说,Hadoop大数据平台也可以看做是新一代的数据仓库系统, 它也具有很多现代数据仓库的特征,也被企业所广泛使用.因为MPP架构的可扩展性,基于MPP的数据仓库系统有时候也被划分到大数据平台类产品. 但是数据仓库和Hadoop平台还是有很多显著的不同.针对不同的使用场景其发挥的作用和给用户带来的体验也不经相同.用户可以根据下表简单判断什么场景更适合用什么样的产品.  数据仓库和Hadoop大数据平台特性比较 特性 Hadoop Data Warehouse 计算节点数 可到数千个 一般在