深入浅出Hadoop实战开发教程

升级版深入浅出Hadoop实战开发(云存储、MapReduce、HBase实战微博、Hive应用、Storm应用)
http://www.ibeifeng.com/goods-488.html
咨询QQ2110053820
课程讲师:明义(robby)
课程分类:Hadoop
适合人群:初级
课时数量:35课时
用到技术:hadoop、MapReduce、hbase、hive
涉及项目:云存储、微博应用等

课程简介:
Hadoop 是一个能够对大量数据进行分布式处理的软件框架。但是 Hadoop 是以一种可靠、高效、
可伸缩的方式进行处理的。Hadoop 是可靠的,因为它假设计算元素和存储会失败,因此它维护多
个工作数据副本,确保能够针对失败的节点重新分布处理。Hadoop 是高效的,因为它以并行的方
式工作,通过并行处理加快处理速度。Hadoop 还是可伸缩的,能够处理 PB 级数据。此外,Hadoop
依赖于社区服务器,因此它的成本比较低,任何人都可以使用。

课程大纲:
01课程介绍,HDFS架构和原理,搭建CentOS开发环境
Hadoop背景
HDFS设计目标,应用场景,架构分析
使用Virtual安装CentOS虚拟机
虚拟机环境配置

02hdfs单机和集群的配置安装
Hadoop单机版安装和配置
Hadoop集群安装和配置
Hadoop命令行和WebUI的使用

03hdfs应用-云存储系统(1)
云存储系统介绍和基本架构
搭建Eclipse和Maven开发环境
使用Maven创建并配置Struts2应用
使用bootstrap搭建UI框架

04hdfs应用-云存储系统(2)
安装和配置Redis
用户管理模块开发

05hdfs应用-云存储系统(3)
gson介绍和使用实例
实现普通的文件上传,删除,下载

06hdfs应用-云存储系统(4)
实现基于HDFS的上传,下载和删除
HDFS小文件管理方式:SequenceFile和Har

07深入hdfs-NameNode和DataNode
hdfs的架构介绍
hdfs如何读写文件
FSImage和EditLog
Rack Awareness
hdfs基本管理

08深入hdfs-HDFS federation
HDFS节点管理
HDFS升级和回滚
HDFS Federation
如何使用ViewFS

09namenode HA
zookeeper配置
namenode HA(双机)安装和配置

10yarn和mapreduce
配置Yarn(单机和集群)
MapReduce的工作原理
第一个MapRedcue程序
Yarn命令行工具

11mapreduce应用-搜索提示(1)
工作原理介绍(Ajax)
使用JQuery的AutoComplete控件搭建UI

12mapreduce应用-搜索提示(2)
继承Mapreduce程序
使用Redis保存中间数据
如何对增量和全量数据进行统计
”潜在好友推荐“算法介绍

13mapreduce的采样工具和partitiion
采样和分区的工作原理
RandomSampler,InputSampler,IntervalSampler
TotalOrderPartitioner(全局排序)

14Map Join和Reduce Join
Reduce side join
Map side join
如何自定义数据类型
如何使用DistributedCache

15mapreduce应用-PageRank
PageRank算法详细讲解
如何用mapreduce实现PageRank算法

16,Hive入门
Hive的架构
CLI, Hive Server, HWI介绍
配置Hive,使用Mysql存储元数据
CLI的基本使用

17hive应用-搜索提示(1)
Tomcat日志解析
使用正则表达式解析Tomcat日志
在查询中使用正则表达式

18hive应用-搜索提示(2)
在hive查询中调用python脚本实现Redis插入

19HQL(1)
HQL基础:DDL,DML
数据类型:原子与集合
TextFile的默认编码及自定义编码

20HQL(2)
Hive查询
正则表达式,基本函数,集合函数,表函数
嵌套查询,case when语句,like和rlike
Groupby和Having等

21Hive自定义函数
如何编写自定义函数
在自定义函数中连接Redis
在自定义函数中使用CacheFile

HBase详细介绍
HBase的系统架构
HBase的表结构,RowKey,列族和时间戳
HBase中的Master,Region以及Region Server
使用HBase实现微博应用(1)
用户注册,登陆和注销的设计
搭建环境 struts2 + jsp + bootstrap + jquery + HBase Java API
HBase和用户相关的表结构设计
用户注册的实现
使用HBase实现微博应用(2)
使用session实现用户登录和注销
“关注"功能的设计
“关注"功能的表结构设计
“关注"功能的实现
使用HBase实现微博应用(3)
“发微博"功能的设计
“发微博"功能的表结构设计
“发微博"功能的实现
展现整个应用的运行
HBase应用实战:话单查询与统计(1)
应用的整体设计
开发环境搭建
表结构设计
HBase应用实战:话单查询与统计(2)
话单入库单设计与实现
话单查询的设计与实现
HBase应用实战:话单查询与统计(3)
统计功能设计
统计功能实现
Storm入门及应用

时间: 2024-08-09 10:24:15

深入浅出Hadoop实战开发教程的相关文章

升级版:深入浅出Hadoop实战开发(云存储、MapReduce、HBase实战微博、Hive应用、Storm应用)

      Hadoop是一个分布式系统基础架构,由Apache基金会开发.用户可以在不了解分布式底层细节的情况下,开发分布式程序.充分利用集群的威力高速运算和存储.Hadoop实现了一个分布式文件系统(Hadoop Distributed File System),简称HDFS.HDFS有着高容错性的特点,并且设计用来部署在低廉的(low-cost)硬件上.而且它提供高传输率(high throughput)来访问应用程序的数据,适合那些有着超大数据集(large data set)的应用程序

深入浅出Hadoop实战开发实例视频教程

Hadoop实例视频教程-深入浅出Hadoop实战开发Hadoop是什么,为什么要学习Hadoop?Hadoop是一个分布式系统基础架构,由Apache基金会开发.用户可以在不了解分布式底层细节的情况下,开发分布式程序.充分利用集群的威力高速运算和存储.Hadoop实现了一个分布式文件系统(Hadoop Distributed File System),简称HDFS.HDFS有着高容错性的特点,并且设计用来部署在低廉的(low-cost)硬件上.而且它提供高传输率(high throughput

深入浅出Hadoop实战开发(HDFS实战图片、MapReduce、HBase实战微博、Hive应用)

Hadoop是什么,为什么要学习Hadoop?     Hadoop是一个分布式系统基础架构,由Apache基金会开发.用户可以在不了解分布式底层细节的情况下,开发分布式程序.充分利用集群的威力高速运算和存储.Hadoop实现了一个分布式文件系统(Hadoop Distributed File System),简称HDFS.HDFS有着高容错性的特点,并且设计用来部署在低廉的(low-cost)硬件上.而且它提供高传输率(high throughput)来访问应用程序的数据,适合那些有着超大数据

100套最适合自学的实战开发教程视频(程序员都在学)

BAT大咖助力 全面升级Android面试 BAT大牛亲授 基于ElasticSearch的搜房网实战 从天气项目看Spring Cloud微服务治理 Java企业级电商项目架构演进之路  Tomcat集群与Redis分布式 Java深入微服务原理改造房产销售平台 SSM到Spring Boot-从零开发校园商铺平台 Java Spring Boot企业微信点餐系统 Java秒杀系统方案优化-高性能高并发实战 Spring Boot技术栈博客企业前后端 Java SSM快速开发仿慕课网在线教育平

分享RED5Flex流媒体应用实战开发教程

咨询QQ:2050339477 课程链接:http://ibeifeng.taobao.com/ 课程背景: Flash RIA技术是目前国际上最流行和最前沿的技术趋势之一,被广泛应用于网页游戏和手机游戏.动漫.软件.在线视频.广 告互动.网站.教育课件等热门行业.   据权威部门调查,Flash RIA相关产业在我国未来五年的产值是3000亿元以上,仅国内目前需 求最旺盛的网页游戏和手机游戏行业,每年带来的产值就高达200亿元以上,而这个领域的人才缺口已经达到了每年十万人,巨大的 人才需求造就

PHP实战开发教程

对于PHP初学者来说,一上手就学习庞大的PHP语法无疑很打击自信心.其实即便是很熟练的程序员,也未必对所有的语法非常熟悉.通常熟练的程序员比普通的程序员的优势在于对基本语法的理解非常透彻,而且常用的一些基础代码块基本上可以不用费脑筋直接写出来.再深入一点,便是借助一些著名的PHP开发框架,加上自己项目中经常用到的一些自己编写的可重用模块或者类库,从而快速而有效地开发各种系统. 因此,与其花费时间在PHP语法的学习,不如一上手便教给初学者这些实用的东西,也就是基本的技巧,项目开发的必备技能,以及总

.NET基础教程免费学,.NET实战开发教程

零基础学.NET平台和Csharp编程开发 http://edu.ibeifeng.com/view-index-id-524.html 基于ASP.NET MVC4和Knockout.JS等技术实现Web通用商业框架 http://edu.ibeifeng.com/view-index-id-393.html ASP.NET之cms文章内容管理系统 http://edu.ibeifeng.com/view-index-id-359.html 专题:asp.net下的工作流技术WF4.0 htt

实战厕所在哪APP视频教程 react native服务端实战项目实战开发教程

一个很好且包含服务端的实战项目视频教程!学习本视频最后有Node基础! ------------------课程目录------------------ <react native 快速开发App>├reactnative厕所在哪源码.zip├<第八章 App阅读模块开发>│  ├8-1 阅读模块功能设计.avi│  ├8-10 列表使用listview组件.avi│  ├8-11 数据列表展示.avi│  ├8-12 完善详情页.avi│  ├8-2 五大模块创建和加载.avi│

Hadoop应用开发实战(flume应用开发、搜索引擎算法、Pipes、集群、PageRank算法)

Hadoop是2013年最热门的技术之一,通过北风网robby老师<深入浅出Hadoop实战开发>.<Hadoop应用开发实战>两套课程的学习,普通Java开发人员可以在最快的时间内提升工资超过15000.成为一位完全精通Hadoop应用开发的高端人才. Hadoop是什么,为什么要学习Hadoop? Hadoop是一个分布式系统基础架构,由Apache基金会开发.用户可以在不了解分布式底层细节的情况下,开发分布式程序.充分利用集群的威力高速运算和存储.Hadoop实现了一个分布式