Cloudera manager的服务安装以及spark升级到2.2

一、Cloudera manager的服务安装

包含2个:

1、 是软件包的分发、安装

此种方式安装的时候。Cloudera manager会在激活这个步骤验证软件的版本和当前cdh的兼容性。如果不符合会提示,并且不能激活。

(1)、包的在线安装

上一步中配置会打开这个界面进行:下载地址的配置。

点击分配步骤之后,.parcel的软件包在每台机器上就已经复制了,并且是解压好的安装包。

(2)、通过自己下载.parcel,上传到软件包目录

此种方式安装的时候。Cloudera manager在激活这个步骤验证软件的版本和当前cdh的兼容性。

(2.1).上传parcel包到Cloudera manager主节点所在机器的/opt/cloudera/parcel-repo

(2.2).一般包含一下三个文件,如果没有.parcel.sha文件就自己创建一个。里面的码就是manifest.json文件里面组件的hash的值。

文件下载、上传到指定目录之后,后面的操作和在线下载的方式是一样的。检查新Parcel、分配、激活。

        如果一个软件包就是比较简单的(只要求有对应jar,没有分配组件等复杂管理)、或者软件包比较新cloudera manager没有提供对应的添加服务的界面选项。应该到这里就结束了。

2、 是服务管理的界面:主要是添加服务、选择角色所在的机器、管理服务的运行、配置等。

服务管理界面这块cloudera manager上我没有发现自动分发、配置的功能。都是手动同步配置和软件到各个机器上的。

Web服务管理包的路径在  /opt/cloudera/csd/

详细的步骤请参见下文的spark服务管理界面的安装。

=========================================

此步骤不确定是否必要。

二、scala环境的安装

安装scala

1、下载

https://downloads.lightbend.com/scala/2.12.4/scala-2.12.4.tgz

2、解压

tar -xvf scala-2.12.4.tgz

3、添加到环境

vim /etc/profile

#set scala

export SCALA_HOME=/usr/scala-2.12.4

export PATH=$PATH:$SCALA_HOME/bin

复制到其他机器

scp -r /usr/scala-2.12.4/ [email protected]68.180.224:/usr/scala-2.12.4/

生效环境

source /etc/profile

=========================================

三、spark2.2软件包的安装

spark2的安装地址

下载地址

http://archive.cloudera.com/spark2

这里需要说明一下。Cloudera manager里面组件的安装提供了cloudera2和cloudera1这2中版本的软件包。

根据下面这个网页的说:其实就是hive关联软件导致的cdh版本的要求。总体看来cloudera2版本的软件包兼容更广泛。

1版本的可能有的cdh版本需要升级才能兼容要安装的软件包

https://www.cloudera.com/documentation/spark2/latest/topics/spark2_requirements.html

最终选择了下面这个地址的spark版本,通过在线下载的方式进行了安装。

http://archive.cloudera.com/spark2/parcels/2.2.0.cloudera2/

=========================================

四、spark2.2web服务关联的安装

由于担心版本冲突,我先卸载了cloudera manager自带的spark1.6版本。

重新安装spark2.2版本的软件包和对应的web服务管理功能。

下载添加web服务的组件

地址

http://archive.cloudera.com/spark2/csd/

要下载的文件

SPARK2_ON_YARN-2.2.0.cloudera2.jar

SPARK2_ON_YARN-2.2.0.cloudera2.jar.sha

如果是SPARK2_ON_YARN-2.2.0.cloudera2.jar.sha1请重命名一下,把后缀名.sha1改成sha.

---------------------------------------

/opt/cloudera/

以下操作在每个节点执行:

把上面的2个文件上传到/opt/cloudera/csd/目录

授权(变更所属组和拥有者)

cd /opt/cloudera/csd/

chgrp cloudera-scm SPARK2_ON_YARN-2.2.0.cloudera2.jar

chgrp cloudera-scm SPARK2_ON_YARN-2.2.0.cloudera2.jar.sha

chown cloudera-scm SPARK2_ON_YARN-2.2.0.cloudera2.jar

chown cloudera-scm SPARK2_ON_YARN-2.2.0.cloudera2.jar.sha

重启

/opt/cm-5.11.1/etc/init.d/cloudera-scm-agent restart

/opt/cm-5.11.1/etc/init.d/cloudera-scm-server restart

重启之后,就应该能在添加服务里面看到spark2了

如果重启之后还看不到看到spark2这个服务。请查验.parcel包是否和web管理服务包的版本对应的上。

=========================================

五、测试代码是否有效

/opt/cloudera/parcels/SPARK2-2.2.0.cloudera2-1.cdh5.12.0.p0.232957/lib/spark2/examples/jars/

./bin/spark-submit --class org.apache.spark.examples.SparkPi --master yarn-client examples/jars/spark-examples_2.11-2.2.0.cloudera2.jar

cloudera manager自己安装的spark2目录

cd /opt/cloudera/parcels/SPARK2-2.2.0.cloudera2-1.cdh5.12.0.p0.232957/bin/

spark2-submit --class org.apache.spark.examples.SparkPi --master yarn-client /opt/cloudera/parcels/SPARK2-2.2.0.cloudera2-1.cdh5.12.0.p0.232957/lib/spark2/examples/jars/spark-examples_2.11-2.2.0.cloudera2.jar

运行会报错,需要在运行的机器上都安装getway,并且刷新客户端配置。Spark可能需要它来获取hadoop的配置信息。

原文地址:https://www.cnblogs.com/double-kill/p/8413508.html

时间: 2024-08-04 17:28:03

Cloudera manager的服务安装以及spark升级到2.2的相关文章

Hadoop 离线安装 CDH5.1 第二章:cloudera manager与agent 安装

新建cloudera-scm用户 (做了分行,这个是一条linux命令,) [[email protected] cloudera-manager-5.1.0]$ sudo useradd --system  --home=/opt/cloudera-manager-5.1.0/run/cloudera-scm-server  --no-create-home --shell=/bin/false --comment "Cloudera SCM User" cloudera-scm 改

如何利用Cloudera Manager来手动安装parcel包

1.问题的描述: 当你利用Cloudera Manager部署了CDH的集群后,也许随着你的业务需求,你需要对你的就去哪做一些优化,或者扩展之类的,这个时候你可能需要下载安装一些组件.例如,我最近在阅读Cloudera 官方文档的是,看到有一节的内容说到Performance Management的时候,发现为了提升集群的性能,经常会将数据进行压缩,此时就会需要添加一些parcel的安装. 2.方法详述: 为了能够安装自己想要的parcel的软件包,采用的方式可以: (1)在ClouderaMa

Cloudera Manager (centos)安装详细介绍

文章全部来自:Cloudera Manager (centos)安装详细介绍http://www.aboutyun.com/thread-9190-1-1.html(出处: about云开发) 这里已经有很多关于CDH的文章,此篇虽然不是把所有的问题都描述了.但是整体的过程还算描述的比较清楚.问题导读: 1.安装需要做哪些准备? 2.如何安装CM? 3.如何通过CM安装CDH? 4.CM及CDH安装的过程都包含什么? 相信通过这篇文章大家都对Cloudera Manager及CDH安装有一个整体

离线部署 Cloudera Manager 5 和 CDH 5.12.1 及使用 CDH 部署 Hadoop 集群服务

Cloudera Manager Cloudera Manager 分为两个部分:CDH和CM. CDH是Cloudera Distribution Hadoop的简称,顾名思义,就是cloudera公司发布的Hadoop版本,封装了Apache Hadoop,提供Hadoop所有的服务,包括HDFS,YARN,MapReduce以及各种相关的components:HBase, Hive, ZooKeeper,Kafka等. CM是cloudera manager的简称,是CDH的管理平台,主要

全网最全Centos7 Cloudera Manager 安装与使用

全网最全Centos7 安装与使用 Cloudera Manager  一.准备工作 1.修改hostname 2.关闭selinux 3.关闭防火墙 4.配置hosts 5.安装JDK 6.配置环境变量 二.安装Cloudera Manager  1.从官网下载CDH软件包和Cloudera Manager 安装包 2.安装相关依赖组件 3.启动Httpd服务 4.配置NTP时钟同步 5.安装MySQL 6.Cloudera Manager Server的安装 7.Cloudera Manag

卸载 Cloudera Manager 5.1.x.和 相关软件【官网翻译】

问题导读: 1.不同的安装方式,卸载方法存在什么区别?2.不同的操作系统,卸载 Cloudera Manager Server and 数据库有什么区别? 重新安装不完整如果你来到这里,因为你的安装没有完成(例如,如果它是由一个虚拟机超时中断),和你想继续安装,然后重新安装,做到以下几点:删除文件和目录: 个人建议:这一步虽然是官网这么做,但是下面命令还是不要执行,因为我们后面还会用到下面命令 /usr/share/cmf/uninstall-cloudera-manager.sh 复制代码 当

Cloudera Manager Server CDH 5.15部署

安装前准备 主机和系统 Host OS Memory IP bigdata001-dev Cent OS 7.4 x64 32G 192.168.1.1 bigdata002-dev Cent OS 7.4 x64 32G 192.168.1.2 bigdata003-dev Cent OS 7.4 x64 15G 192.168.1.3 bigdata004-dev Cent OS 7.4 x64 32 192.168.1.4 安装包下载 下载 cloudera-manager.repo 文件

CentOS7 Cloudera Manager6 完全离线安装 CDH6 集群

本文是在CentOS7.4 下进行CDH6集群的完全离线部署.CDH5集群与CDH6集群的部署区别比较大. 说明:本文内容所有操作都是在root用户下进行的. 文件下载 首先一些安装CDH6集群的必须文件要先在外网环境先下载好. Cloudera Manager 6.3.0 CM6 RPM:https://archive.cloudera.com/cm6/6.3.0/redhat7/yum/RPMS/x86_64/ 需要下载该链接下的所有RPM文件,保存到cloudera-repos目录下. A

离线安装Cloudera Manager 5.3

离线安装ClouderaManager 5.3   关于CDH和ClouderaManager CDH (Cloudera's Distribution, including Apache Hadoop),是Hadoop众多分支中的一种,由Cloudera维护,基于稳定版本的ApacheHadoop构建,并集成了很多补丁,可直接用于生产环境(本次项目环境使用了4个节点的CDH5.1.3版本). Cloudera Manager则是为了便于在集群中进行Hadoop等大数据处理相关的服务安装和监控管