CDH 5.15.2 离线安装

一、前置准备

1. 基础信息

1.1 机器

机器名 服务
hadoop1 主节点
hadoop2 data、task
hadoop3 data、task

1.2 服务版本

服务 版本
cdh 5.15.2
cm 5.15.2
jdk 1.8

2. 创建hadoop用户

不直接建议使用root用户,所以此处新建 hadoop用户

2.1 添加用户组及用户,配置密码

# 添加用户组
groupadd hadoop

# 添加用户
useradd -m -g hadoop hadoop

# 配置密码
passwd hadoop

2.2 sudo权限

visudo

# 在最后增加
hadoop ALL=(ALL)  NOPASSWD:ALL

3. 修改机器名并配置hosts

3.1 修改network文件

vim /etc/sysconfig/network

# 增加或修改
HOSTNAME=hadoop1

# 此配置需要重启才可以生效
shutdown -r now

3.2 修改hosts文件

127.0.0.1 hadoop1 s1
127.0.0.2 hadoop2 s2
127.0.0.3 hadoop3 s3

注意: /etc/hosts 中绝对不可以出现带有下划线的host名称,否则agent会启动不起来。

4. 机器之间免密码登录

为了便于维护,各机器使用相同的ssh key

# 在主节点生成公钥,一路回车即可
ssh-keygen -t rsa

# 生成一个authorized_keys文件
cat ~/.ssh/id_rsa.pub > ~/.ssh/authorized_keys

# 文件权限
chmod 600  ~/.ssh/authorized_keys

# 将生成的id_rsa.pub和authorized_keys拷贝到其它节点,必须保证上面所需的权限
scp -r ~/.ssh [email protected]:~/
scp -r ~/.ssh [email protected]:~/

# 如果没有scp,则安装
yum install openssh-clients

5. 修改系统资源参数

5.1 修改 90-nproc.conf

vim /etc/security/limits.d/90-nproc.conf

# 修改
soft nproc 65535

5.2 修改 limits.conf

vim /etc/security/limits.conf

# 增加
soft nproc 65535
hard nproc 65535

6. 安装 jdk

  • 版本:jdk1.8
  • 安装方式:rpm(此方式不需要手动配置环境变量)

6.1 查看centos是否自带了openjdk,如果带了则卸载掉

# 查看
rpm -qa | grep java
或 rpm -qa | grep jdk

# 卸载
rpm -e --nodeps 包名

6.2 安装

官网下载地址

安装:

rpm -ivh jdk-8u211-linux-x64.rpm

6.3 配置全局的JAVA_HOME变量

此命令需要切换到root用户下完成

echo "JAVA_HOME=/usr/java/latest/" >> /etc/environment

7. 安装mysql

生产环境建议使用RDS或配置主从服务放置出现单点故障,此处直接使用yum安装

7.1 安装mysql-server及mysql-connector-java

# 安装
yum install mysql-server
yum install mysql-connector-java

# 启动
service mysqld start
/sbin/chkconfig mysqld on

# 设置开机启动
chkconfig mysqld on 设置开机启动

# 设置root密码:
mysqladmin -u root password '123456'

7.2 创建元数据库

# hive
CREATE USER 'hive'@'127.0.0.1' IDENTIFIED BY '******';
CREATE DATABASE IF NOT EXISTS hive default charset utf8 COLLATE utf8_general_ci;
GRANT ALL PRIVILEGES ON `hive`.* TO 'hive'@'127.0.0.1';  

# activity monitor
CREATE USER 'monitor'@'127.0.0.1' IDENTIFIED BY '******';
CREATE DATABASE IF NOT EXISTS monitor default charset utf8 COLLATE utf8_general_ci;
GRANT ALL PRIVILEGES ON `monitor`.* TO 'monitor'@'127.0.0.1';

# oozie
CREATE USER 'oozie'@'127.0.0.1' IDENTIFIED BY '******';
CREATE DATABASE IF NOT EXISTS oozie default charset utf8 COLLATE utf8_general_ci;
GRANT ALL PRIVILEGES ON `oozie`.* TO 'oozie'@'127.0.0.1';

# hue
CREATE USER 'hue'@'127.0.0.1' IDENTIFIED BY '******';
CREATE DATABASE IF NOT EXISTS hue default charset utf8 COLLATE utf8_general_ci;
GRANT ALL PRIVILEGES ON `hue`.* TO 'hue'@'127.0.0.1';

# 刷新权限
flush privileges;

8. YUM安装服务所需要的RPM依赖

过程中如果出现找不到的包,可以通过 sudo yum whatprovides xxx,确定rpm包

sudo yum -y install bind-utils portmap fuse-libs httpd mod_ssl python-psycopg2 MySQL-python
sudo yum -y install libxml2-devel libxslt-devel
sudo yum -y install cyrus-sasl-plain cyrus-sasl-devel cyrus-sasl-gssapi
sudo yum -y install fuse redhat-lsb-core-4.0-7.el6.centos.x86_64
sudo yum -y install openssl-devel

二、正式安装

1 下载所需要RPM包

下载地址

cloudera-manager-daemons-5.15.2-1.cm5152.p0.2.el6.x86_64.rpm
cloudera-manager-server-5.15.2-1.cm5152.p0.2.el6.x86_64.rpm
cloudera-manager-agent-5.15.2-1.cm5152.p0.2.el6.x86_64.rpm

2 安装 RPM

# 主节点
sudo rpm -ivh cloudera-manager-daemons-5.15.2-1.cm5152.p0.2.el6.x86_64.rpm cloudera-manager-server-5.15.2-1.cm5152.p0.2.el6.x86_64.rpm cloudera-manager-agent-5.15.2-1.cm5152.p0.2.el6.x86_64.rpm

# 从节点
sudo rpm -ivh cloudera-manager-daemons-5.15.2-1.cm5152.p0.2.el6.x86_64.rpm cloudera-manager-agent-5.15.2-1.cm5152.p0.2.el6.x86_64.rpm

3 配置jdk

vim /etc/default/cloudera-scm-server
# 加入
export JAVA_HOME="/usr/java/latest"

vim /etc/default/cloudera-scm-agent
# 加入
export JAVA_HOME="/usr/java/latest"

4 把mysql-connector-java-5.1.43-bin.jar放到/usr/share/cmf/lib/

sudo cp mysql-connector-java-5.1.43-bin.jar /usr/share/cmf/lib/

5 主节点初始化CM5的数据库

rpm安装脚本目录在/usr/share/cmf/schema/scm_prepare_database.sh

脚本所需参数:数据库类型、数据库主机名或ip、数据库端口、建库用户名、密码、cmserver主机名、数据库的管理用户名、密码

sudo -E /usr/share/cmf/schema/scm_prepare_database.sh mysql   -hlocalhost -P3306 -uroot -p'123456' --scm-host 127.0.0.1 cloudera cm '123456'

看到下面的内容,则配置成功
?

6 配置 agent

6.1 修改所有节点的 server_host 为主节点的机器名

sudo vim /etc/cloudera-scm-agent/config.ini
# 修改
server_host=hadoop1

6.2 所有节点上创建 cloudera-scm 用户

sudo useradd --system --home=/var/run/cloudera-scm-server/ -create-home --shell=/bin/false --comment "Cloudera SCM User" cloudera-scm

7 准备 parcels 文件

CDH parcels下载地址
GPLEXTRAS parcels下载地址

CDH-5.15.2-1.cdh5.15.2.p0.3-el6.parcel
CDH-5.15.2-1.cdh5.15.2.p0.3-el6.parcel.sha1
GPLEXTRAS-5.7.6-1.cdh5.7.6.p0.6-el6.parcel
GPLEXTRAS-5.7.6-1.cdh5.7.6.p0.6-el6.parcel.sha1
  1. 在主节点上将上述文件放到 /opt/cloudera/parcel-repo/ 目录中,如果没有parcel-repo文件夹,则自己创建
  2. 将.sha1的文件改名为.sha,否则无法识别

8. 启动server、agent服务

  • 执行命令要用sudo权限,-E 加载环境变量,否则会报错
  • 启动的其实是个service脚本,如需停止/重启服务将start改为stop/restart即可
# 启动服务端
sudo -E /etc/init.d/cloudera-scm-server start
# 启动Agent服务
sudo -E /etc/init.d/cloudera-scm-agent start

9. 将MYSQL的JDBC JAR包拷贝到HIVE和OOZIE的LIB下

10. 转战web页面

10.1 http://主节点ip:7180,初始账号及密码均为admin

?

10.2 是的,继续

?

10.3 免费版,继续

?

10.4 继续

?

10.5 之前的agent配置,会扫描到当前管理的集群机器,继续

?

10.6 选择CDH版本这里会显示你放在/opt/cloudera/parcel-repo/下的parcel包,若未显示,则检查.sha1是否名称未改为.sha,并注意文件用户权限为cloudera-scm,修改之后重启server服务和agent服务,重新登录web即可显示,然后继续

?

10.7 因为均是实现下载好的,所以此过程很快,继续

?

10.8 检查主机

?

都不是什么大问题,按提示,修改后点击“重新运行”,每个节点上都设置一下:
第一个警告:

# 切换到root用户执行
echo 10 > /proc/sys/vm/swappiness

# 添加或修改sysctl.conf
vim /etc/sysctl.conf
vm.swappiness = 0

第二个警告:

# 执行:
echo never > /sys/kernel/mm/transparent_hugepage/defrag
echo never > /sys/kernel/mm/transparent_hugepage/enabled 

# 编辑rc.local加入上面两行
vim /etc/rc.local
10.9 选择并安装服务

?

10.10 数据库设置,输入之前建好的用户名密码,继续

?

10.11 然后一直默认,继续即可,直到如下页面即为安装成功

?

原文地址:https://www.cnblogs.com/remainsu/p/cdh-5152-li-xian-an-zhuang.html

时间: 2024-07-28 18:03:29

CDH 5.15.2 离线安装的相关文章

Cloudera CDH 离线安装与使用

CDH 在线安装方法如下,方便,但是由于在国内,访问这个网站的速度很慢,并不快捷. 在线安装Cloudera Manager服务器 # 配置cloudera-cdh源和cloudera-manager源 # cloudera-manager wget http://archive.cloudera.com/cm5/redhat/6/x86_64/cm/cloudera-manager.repo # cloudera-cdh wget https://archive.cloudera.com/cd

CDH 离线安装部署

CDH相关介绍:  参考链接: https://blog.csdn.net/u013061459/article/details/73368929 https://www.cnblogs.com/raphael5200/p/5293960.html 为了构建一个以数据为驱动的业务场景,我们需要一个强大的管理工具去统一并安全地管理我们的业务数据,Cloudera做为一个强大的数据中心管理工具为此孕育而生.Cloudera不光提供了自己衍化重新封装的市场领先并100%开源的商业化Apache Had

离线安装Cloudera Manager 5和CDH5(最新版5.1.3) 完全教程

原文  http://www.cnblogs.com/jasondan/p/4011153.html 关于CDH和Cloudera Manager CDH (Cloudera's Distribution, including Apache Hadoop),是Hadoop众多分支中的一种,由Cloudera维护,基于稳定版本的Apache Hadoop构建,并集成了很多补丁,可直接用于生产环境. Cloudera Manager则是为了便于在集群中进行Hadoop等大数据处理相关的服务安装和监控

完全离线安装VSCode插件--Eslint

最近折腾了一番,总算把Eslint插件在离线的情况下安装好了.之前查了挺多,但是很多方法还是在没有完全离线的情况下进行的.之所以想完全离线安装,主要是因为我们工作的地方是禁止访问外网的,所以像直接执行npm命令来进行一些包的安装,其实对我来说是用不了的. 好了,现在进入正题,说下我的解决方式吧. 1.在无法联网的电脑上先把VSCode安装好. 2.在家里有网的电脑上,在vsCode里面的扩展直接安装eslint插件,然后在该路径(C:\Users\Administrator\.vscode\ex

Visual Studio for Mac离线安装教程

Visual Studio for Mac离线安装教程 可以在线安装,也可以离线安装(本次安装博主使用离线,在线安装失败了) 于是选择离线安装………… 离线安装步骤 下载离线安装包链接地址: VisualStudioForMac-7.0.0.3146.dmg文件 下载地址:  http://t.cn/RaJ15n6 百度网盘下载地址:链接:http://pan.baidu.com/s/1bYR8RG 密码:cw32 MonoFramework-MDK-5.0.0.100.macos10.xama

离线安装docker最新版,记得要以下三个包。

如果安装了以前版本,还要删除以下这个包. container-selinux.noarch 2:2.10-2.el7 ============== 离线安装三个rpm -rw-r--r--. 1 root root 19524568 May 15 10:04 docker-ce-17.03.1.ce-1.el7.centos.x86_64.rpm-rw-r--r--. 1 root root 29108 May 15 10:04 docker-ce-selinux-17.03.1.ce-1.el

CentOS 6.x 离线安装 Cloudera 5.7.x - 未完成

因为开发需要在本地组建一个Hadoop/Spark集群,但公司IT政策不允许本地集群接入互联网,所以只能离线安装各种组件. 下面把安装过程记录下来,作为项目文档. 安装准备工作 主机和系统 HadoopMaster Cent OS 6.4 x64 16G 192.168.1.10 HadoopSlave1 Cent OS 6.4 x64 16G 192.168.1.11 HadoopSlave2 Cent OS 6.4 x64 8G 192.168.1.12 安装包下载 可以自行到下面列出的文件

CDH5.7快速离线安装教程

一.简介 CDH是cloudera公司开发的一个快速部署.高效管理Hadoop和其各种组件的一个商业化产品.主要分为两部分,分别为Cloudera Manager和CDH软件包.其中Cloudera Manager负责集群的部署与管理.CDH软件包囊括了hdaoop各类的组件的安装包,例如hive.hdfs.spark等等. 由于实验室服务器集群实现了硬件虚拟化,要在虚拟资源重新搭建CDH集群.cloudera的搭建官方提供了三种安装方式.分别是在线安装.yum安装和离线安装,我首先是采用离线安

离线安装Cloudera Manager 5.3

离线安装ClouderaManager 5.3   关于CDH和ClouderaManager CDH (Cloudera's Distribution, including Apache Hadoop),是Hadoop众多分支中的一种,由Cloudera维护,基于稳定版本的ApacheHadoop构建,并集成了很多补丁,可直接用于生产环境(本次项目环境使用了4个节点的CDH5.1.3版本). Cloudera Manager则是为了便于在集群中进行Hadoop等大数据处理相关的服务安装和监控管