Tez 整合Hadoop CDH 5.3.0安装部署

    子曰君子食无求饱,居无求安,敏于事而慎于言,就有道而正焉,可谓好学也已。

    译文:君子吃不求太饱,住不求太舒适,做事勤快,说话谨慎,向道德高的人学习,并能改正自己的缺点,这样就可以称得上好学了。

  最近要把CDH的版本换成了5.3.0,hive的版本从0.12换成了0.13,升级完成后,简单测试发现版本的升级对性能的影响非常大。hive在0.13中开始支持tez做为执行引擎来提高执行速度。

  

  Tez 和 MR 的对比图:

  图中可以看出原始的 MR 程序是多job 的DAG,每个job都会进行写盘和读盘操作,浪费了磁盘IO和网络IO。 Tez则把多job的DAG改为单个job的DAG任务,减少的中间结果的操作。

Tez 的安装部署:

  hadoop版本:2.5.0

  hive版本:0.13

  tez版本:0.4.1

  1.)下载tez源码,地址:http://archive.apache.org/dist/incubator/tez/tez-0.4.1-incubating/

  2.)编译:

    1:依赖环境

      a、JDK 1.7 +

      b、maven 3.0 +

      c、ProtocolBuffer 2.5.0

    2:修改pom.xml中的hadoop版本为对应的版本号 2.5.0

    3:编译命令:mvn clean package -DskipTests=true -Dmaven.javadoc.skip=true  静静的等待吧..........

  3.)上传编译后的Tez的tarball到集群的各个机器中,并解压到自己想要安装的目录中。

  4.)上传tez解压后的文件到HDFS中

    。建立目录 hadoop fs -mkdir /apps

    。上传文件 hadoop fs -put {TEZ_HOME} /apps/

  5.)在hadoop的配置文件目录中新建 tez-site.xml 配置文件

    。添加配置 tez.lib.uris

1 <property>
2   <name>tez.lib.uris</name>
3   <value>${fs.defaultFS}/apps/tez,${fs.defaultFS}/apps/tez/lib</value>
4 </property>

  6.)修改 mapred-site.xml

  7.)在hadoop-env.sh 把 tez 的jar添加到HADOOP_CLASSPATH中

1 export TEZ_HOME={TEZ_HOME}
2 export HADOOP_CLASSPATH=${HADOOP_CLASSPATH}:${TEZ_HOME}/*:${TEZ_HOME}/lib/*

  8.)至此 Tez 的部署结束,运行Tez的测试程序:hadoop jar tez-tests.jar testorderedwordcount <input> <output>

    如果能正常运行,就说明部署成功了。

  9.)修改hive的执行引擎为 Tez

1 <property>
2   <name>hive.execution.engine</name>
3   <value>tez</value>
4 </property>

  

  到此 Tez 整合 CDH 5.3.0 已经大功告成了。开始进入稳定性测试和性能优化吧。

  

  温馨提示: Tez 是需要每台机器都需要部署的。

  Tez官网: http://tez.apache.org/index.html

时间: 2024-10-11 04:21:15

Tez 整合Hadoop CDH 5.3.0安装部署的相关文章

zabbix3.0安装部署文档

zabbix v3.0安装部署 摘要: 本文的安装过程摘自http://www.ttlsa.com/以及http://b.lifec-inc.com ,和站长凉白开的<ZABBIX从入门到精通v3.0.1 - 运维生存时间(2016)>一书. 关于zabbix及相关服务软件版本: Linux:centos 6.6 nginx:1.9.15 MySQL:5.5.49 PHP:5.5.35 一.安装nginx: 安装依赖包: yum -y install gcc gcc-c++ autoconf

SUSE Cloud 2.0 安装部署图文详解

目录 SUSE Cloud 2.0 安装部署... 1 目录... 2 1. 云架构图... 3 2.硬件要求:... 4 3. 软件要求... 5 4. 网络... 5 4.1网络架构:... 5 4.2网卡配置图:... 7 5. 安装管理节点... 7 5.1 安装前基本环境设置... 7 5.2 安装的软件源设置... 8 5.3 管理节点; 9 5.4 yast安装... 9 5.5 命令安装... 9 5.6更新系统... 9 5.7配置管理节点... 9 5.8 安装配置... 1

zabbix v3.0安装部署

zabbix v3.0安装部署 摘要: 本文的安装过程摘自http://www.ttlsa.com/以及http://b.lifec-inc.com ,和站长凉白开的<ZABBIX从入门到精通v3.0.1 - 运维生存时间(2016)>一书. 关于zabbix及相关服务软件版本: Linux:centos 6.6 nginx:1.9.15 MySQL:5.5.49 PHP:5.5.35 一.安装nginx: 安装依赖包: yum -y install gcc gcc-c++ autoconf

centos6.4 docker1.0 安装部署

一:简介: Docker是一个开源的引擎,可以轻松的为任何应用创建一个轻量级的.可移植的.自给自足的容器.开发者在笔记本上编译测试通过的容器可以批量地在生产环境中部署,包括VMs(虚拟机).bare metal.OpenStack 集群和其他的基础应用平台. 二:Docker应用场景: 1.web应用的自动化打包和发布: 2.自动化测试和持续集成.发布: 3.在服务型环境中部署和调整数据库或其他的后台应用: 4.从头编译或者扩展现有的OpenShift或Cloud Foundry平台来搭建自己的

CDH 5.7.0安装,cm agent无法启动

我们在部署完CDH 5.7.0和CM 5.7.0后,开始启动CM Agent,但是会出现下面的错误:# cloudera-scm-agent  startStarting cloudera-scm-agent:                               [FAILED] 问题查找# cat /opt/cloudera-manager/cm-5.7.0/log/cloudera-scm-agent/cloudera-scm-agent.out /opt/cloudera-mana

【甘道夫】Oozie-4.0.0-CDH5.2.0 安装部署

引言 Oozie是Hadoop生态系统中的工作流控制组件,可以调度MR,Hive,Shell等各类任务,并配置复杂的工作流程. 今天介绍如何安装部署,使用的是单机测试环境. 欢迎转载,请注明来源: http://blog.csdn.net/u010967382/article/details/41355953 下载解压 下载安装过程需要的相关文件: oozie4.0.0安装包 http://archive.cloudera.com/cdh5/cdh/5/oozie-4.0.0-cdh5.2.0.

hadoop(1)_HDFS介绍及安装部署

一.hadoop简介 1.hadoop的初衷是为了解决Nutch的海量数据爬取和存储的需要,HDFS来源于google的GFS,MapReduce来源于Google的MapReduce,HBase来源于Google的BigTable.hadoop后被引入Apache基金会. 2.hadoop两大核心设计是HDFS和MapReduce,HDFS是分布式存储系统,提供高可靠性.高扩展性.高吞吐率的数据存储服务;MapReduce是分布式计算框架,具有易于编程.高容错性和高扩展性等优点. 3.hado

fuel6.0安装部署

在经过一系列安装openstack方式后,个人觉得fuel的安装方式相对简易,接下来记录下安装部署fuel6.0的过程.本教程适合想把fuel6.0部署后,云主机需要连接外网的需求. 安装virtualBox的过程这里就不展开了. 虚拟机本地建立的网卡截图: 2张网卡的详细配置信息截图: VirtualBox主界面 导入fuel6.0的镜像后,启动"master"节点即可进行自动化安装.安装成功后,可进入fuel UI登陆界面 进入到Fuel UI,创建命名为"Demo&qu

zabbix3.0 安装部署 使用yum方式

系统:CentOS7.0 全部使用yum安装方式 1.安装zabbix的yum源 # yum install http://repo.zabbix.com/zabbix/3.0/rhel/7/x86_64/zabbix-release-3.0-1.el7.noarch.rpm 2.安装zabbix各组件 # yum install -y zabbix-agent zabbix-get  zabbix-java-gateway  zabbix-server-mysql zabbix-web zab