这本书由宋立桓老师和陈建平老师共同合作,本书的切入点明确而清晰,从Hadoop 生态明星 Cloudera 入手,单刀直入逐步引出各类大数据基础和核心应用框架。 全书系统介绍了大数据的相关知识,全书共十八章(宋立桓老师撰写第一章到第十二章、陈建平撰写第十三章到第十八章),从大数据概述、Cloudera hadoop平台的安装部署、并对大数据hadoop组件分别进行介绍,包括HDFS分布式文件系统、MapReduce计算框架、资源管理框架YARN 、hive数据仓库、数据迁移工具Sqoop、分布式数据库HBase、Zookeeper分布式协调服务、准实时分析系统Impala、分布式消息系统Kafka、ETL工具Kettle、Spark计算框架等知识,最后有两个综合实操案例把所有知识点串起来。本书使用的操作环境是hadoop的商业发行版的Cloudera express(express是免费版本,企业版需付费),全书秉承“实践为主、理论够用”,将演示实验融入到各个知识点讲解中。
本书图书资源下载地址链接:https://pan.baidu.com/s/1-P7Go5gdJLim33_Iju1rfg
提取码:d1tk
如果不能访问,可以发邮件给我[email protected] 索取最新网盘地址
原文地址:http://blog.51cto.com/lihuansong/2317021
时间: 2024-10-11 07:28:03