基于微博数据应用的HBase实战开发
课程观看地址:http://www.xuetuwuyou.com/course/150
课程出自学途无忧网:http://www.xuetuwuyou.com
一、课程用到的软件
1.centos6.7
2.apache-tomcat-7.0.47
3.solr-5.5
4.zookeeper 3.4.6
5.eclipse-jee-neon-R-win32-x86_64
6.jdk1.7_49
7.HBase1.2.2
8.Ganglia3.7.2
9.Sqoop1.99.7
10.Hadoop2.7.2
二、课程目标
当数据量达到TB或PB级的时候,传统关系型数据型已力不从心。在大数据热潮中,推出了NoSQL数据库,这种天生就为分布式存储而设计的技术,尤其以Apache HBase为代表,占领海量数据存储技术的大半壁江山。本教视从实战角度出来,向学员们手把手掌握HBase使用精髓,让学员达到如下目标:
1. 了解分布式存储的原理及架构。
2. 掌握如何使用HBase实现海量数据存储与检索。
3. 掌握HBase在开发中常见的技术大坑与调优技术。
三、适用人群
开发人员、架构师、对分布式存储有兴趣的朋友。
四、课程内容及目录
课时1:HBase简介与部署
课时2:HBase架构与索引算法剖析
课时3:HBase建库建表与CRUD实战
课时4:基于HBase Client API的CRUD实战
课时5:批处理与扫描器实战
课时6:使用Ganglia监控HBase
课时7:过滤器实战之比较过滤器
课时8:过滤器实战之专用过滤器与FilterList
课时9:过滤器实战之自定义过滤器
课时10:Observer协处理器实战之Master级别原理剖析
课时11:Observer协处理器实战之Region级别原理剖析
课时12:Observer协处理器实战之表复制应用实战
课时13:Endpoint协处理器实战之原理剖析
课时14:Endpoint协处理器实战之数据统计应用实战
课时15:使用API管理HBase之核心理论
课时16:使用API管理HBase之编程实战
课时17:使用API管理HBase之编程实战(续)
课时18:搭建分布式HBase集群之Hadoop部署
课时19:搭建分布式HBase集群之HBase部署
课时20:sqoop2部署
课时21:使用sqoop2将mysql数据导入到HBase
课时22:集群管理之节点管理与数据任务
课时23:Rowkey设计与集群常见故障处理
课时24:集群调优经验分享
课时25:项目介绍与Solr环境搭建
课时26:数据层设计与中文分词器配置
课时27:Spring集成HBase之核心操作
课时28:Spring集成HBase之核心操作(续)
课时29:基于dom4j进行数据文件解析
课时30:数据层设计与实现之二级索引开发
课时31:数据层设计与实现之二级索引开发(续)
课时32:Spring集成Solrj之入门操作
课时33:Spring集成Solrj之高级操作
课时34:高亮查询功能开发之一
课时35:高亮查询功能开发之二
课时36:课程总结