CentOS 6.x 离线安装 Cloudera 5.7.x - 未完成

因为开发需要在本地组建一个Hadoop/Spark集群,但公司IT政策不允许本地集群接入互联网,所以只能离线安装各种组件。

下面把安装过程记录下来,作为项目文档。

安装准备工作

主机和系统

HadoopMaster Cent OS 6.4 x64 16G 192.168.1.10
HadoopSlave1 Cent OS 6.4 x64 16G 192.168.1.11
HadoopSlave2 Cent OS 6.4 x64 8G 192.168.1.12

安装包下载

可以自行到下面列出的文件目录里去找最新版本或直接点文件链接下载parcel和sha文件

注意:这里我们用的是Cent OS 6.4所以下载的时候要选择带el6标记的

Cloudera Manager:

文件目录:http://archive.cloudera.com/cm5/cm/5/

Cloudera Manager5.7.1包:http://archive.cloudera.com/cm5/cm/5/cloudera-manager-el6-cm5.7.1_x86_64.tar.gz

CDH:

文件目录:http://archive.cloudera.com/cdh5/parcels/5/

CHD5.7.1 parcel: http://archive.cloudera.com/cdh5/parcels/5.7/CDH-5.7.1-1.cdh5.7.1.p0.11-el6.parcel

CHD5.7.1 sha: http://archive.cloudera.com/cdh5/parcels/5.7/CDH-5.7.1-1.cdh5.7.1.p0.11-el6.parcel.sha1

Kafka:

文件目录:http://archive.cloudera.com/kafka/parcels/2.0.1/

Kafka1.2.0.1 parcel: http://archive.cloudera.com/kafka/parcels/2.0.1/KAFKA-2.0.1-1.2.0.1.p0.5-el6.parcel

Kafka1.2.0.1 sha: http://archive.cloudera.com/kafka/parcels/2.0.1/KAFKA-2.0.1-1.2.0.1.p0.5-el6.parcel.sha1

系统和环境配置

主机名和host文件配置

更改主机名:

打开网络配置

sudo vim /etc/sysconfig/network

如下方式更改主机名,把本台机器的主机名分别改为HadoopMaster/HadoopSlave1/HadoopSlave2

NETWORKING=yes
HOSTNAME=HadoopMaster

重启网络

sudo service network restart

配置hosts文件:

打开hosts文件

sudo vim /etc/hosts

改为如下配置

192.168.1.10   HadoopMaster
192.168.1.11   HadoopSlave1
192.168.1.12   HadoopSlave2

主机之间SSH免密码登录配置

生成SSH密钥

执行下面命令,一路回车~

ssh-keygen -t rsa

执行完之后在~/.ssh/目录下会生成一个保存有公钥的文件:id_rsa.pub

把HadoopMaster公钥追加到SSH验证文件

cat ~/.ssh/id_rsa.pub >> ~/.ssh/authorized_keys

把HadoopSlave1和HadoopSlave2的公钥写入HadoopMaster的~/.ssh/authorized_keys文件,最终生成如下的内容的authorized_keys文件:

ssh-rsa AAAAB3NzaC1yc2EAAAABIwAAAQEArYU2kMXsu75Gzwvuby7OoGzC7GVwxVo+ol/7nJVD    BpKpJLRHRe/d2HSNe9ZZRWLK2tU0e41baMxrYRoAKJA2ujcWfy7t57c3ArO9hA7KJy7MqMiT8WHQ    M3I2Afsx6sVKeQU/czDLXHn+KjwKbR8z0tuycgtxgkaWx1PCpCKeFDAXDVvxYcurSUNaIGL5Egzu    Iy97N52ld/WxUZnRRsTPdpW88JkhWdOV1Bdo4O67rNv5tSYKHXfPwqi8NekqoHIExgVRsHLvM8fe    xvV4mo8lXYdQPRCyrtM9/V+4kSW8eaBO7w6hM9YVZIspSqx0+OqibWTvqSmiAVh0JmUT0MCeVQ==     [email protected]
ssh-rsa AAAAB3NzaC1yc2EAAAABIwAAAQEA7n27x4qSzRQNGQAL+rT1+91IQnM9cwZYFeSUzrJD    GDfwCTJMKnRBYxrDMxTAM6MKjfwwkPzXnbKHLQnDiJKUSdF8H2xcgDMBJLssVQjOc2jSEg/VppQN    hJwObbIL3k1FbU2KxkOp7yW5PIodZrgUwlH5wdXtfsPKimvv72uA1KUiqPbYA3ZJqXw9Bt87K6Sv    IAkvUjshnfaS+wNEBVwW1dhXyz6DHuY+Tn9330+1oYfdmgSjS4ZqvZVothhhV58DNwzAYwINCpBA    tkjFbk/SOf0q/4rSJRpe2yH9xOuZdwqXMfk3dkp0UFZkV2EVSLyaCNKwTbSuKN75FWhgl8QB7w==     [email protected]
ssh-rsa AAAAB3NzaC1yc2EAAAABIwAAAQEAw91O/1NWnbr6/vop+xwnqR/XYNpwkWselzyHNqgD    PYgXXsDHsvOZbpTX7pgOTgVSmlZetCdX4C1lsc/PO8IitvvBS/qWU216lXaqlW61RcliCrYH/RwN    f8XTLx/Ga04w2qEIFlLOiuH6x/KA22muOLYaSIefXv38xj0Hj41iE5ZIseaLuJogn7iqJ6Fq0wQH    i6ueF9BasSWnOHhn6CJamYz3FC9r2m3vwPMkgagPp1FdYyDxodK+MZlwu6TxqP6QQ7BY/Wh5DZK8    C8zpDOZGQgWOrghF58TlZSmJYmukv1NqsY8PCFuoj7vfoUzVKQkyKcEiohwBcTb50vGPl06bMQ==     [email protected]

把HadoopMaster的authorized_keys拷贝到HadoopSlave1和HadoopSlave2

scp ~/.ssh/authorized_keys [email protected]:~/.ssh/
scp ~/.ssh/authorized_keys [email protected]:~/.ssh/

详细步骤请参考:http://www.cnblogs.com/keitsi/p/5653520.html

安装Java 8

旧版本卸载

#查看安装的Java
rpm -qa | grep java

#卸载相应的Java包
rpm -e --nodeps Java包名

安装包下载

打开下面链接下载相关的rpm包

http://www.oracle.com/technetwork/java/javase/downloads/index.html

安装

sudo rpm -ivh jdk-8u91-linux-x64.rpm

在主节点安装配置MySQL(HadoopMaster)

安装

#安装
sudo yum install mysql-server

#开机启动
sudo chkconfig mysqld on

#启动
sudo service mysqld start

#设置root用户密码
sudo mysqladmin -u root password ‘xxxx‘

关闭防火墙和SELinux

如果一个配置端口的话会比较麻烦,所以在安装过程中就把防火墙关闭,可以在安装完成后再根据需求配置

关闭防火墙

临时关闭

sudo service iptables stop

如果要永久关闭,可以修改配置:

sudo chkconfig iptables off

关闭SELinux

临时关闭

sudo setenforce 0

如果要永久关闭,可以修改配置:

sudo vim /etc/selinux/config

设置SELINUX=disabled

安装配置NTP

NTP用于同步各个服务器的时间,如果服务器之间的时间相差太大的话会导致一些服务down掉。

如果是可连接外网并可以连接到时间服务器的话,可以配置,但是这里是内网的测试环境没有办法连接到同步服务器,所以只能自己手机控制时间了!

Cloudera Manager安装

文件上传

把cloudera-manager-el6-cm5.7.1_x86_64.tar上传到Master机并拷贝到所有的Slave机子上

scp cloudera-manager-el6-cm5.7.1_x86_64.tar.gz [email protected]:~
scp cloudera-manager-el6-cm5.7.1_x86_64.tar.gz [email protected]:~

解压文件

所有机器上执行下面命令,把cm的压缩文件解压到/opt/

sudo tar xzvf cloudera-manager-el6-cm5.7.1_x86_64.tar.gz -C /opt/

Agent配置

所有Slave机上配置Master机的主机名

sudo vim /opt/cm-5.7.1/etc/cloudera-scm-agent/config.ini

把server_host设置成Master机的主机名

server_host=HadoopMaster

新建用户cloudera-scm

所有的机器新建cloudera-scm用户,注意把--home设置为对应的路径:

sudo useradd --system --home=/opt/cm-5.7.1/run/cloudera-scm-server/ --no-create-home --shell=/bin/false --comment "Cloudera SCM User" cloudera-scm

为Cloudera Manager建立数据库

下载MySQL驱动

http://dev.mysql.com/downloads/connector/j/

解压把驱动的jar文件上传到/opt/cm-5.7.1/share/cmf/lib

创建数据库

sudo /opt/cm-5.7.1/share/cmf/schema/scm_prepare_database.sh mysql cm -hlocalhost -uroot [email protected] --scm-host localhost scm scm scm
mysql -uroot -pxxxx
create database hive DEFAULT CHARSET utf8 COLLATE utf8_general_ci;

create database amon DEFAULT CHARSET utf8 COLLATE utf8_general_ci;
时间: 2024-08-06 19:42:15

CentOS 6.x 离线安装 Cloudera 5.7.x - 未完成的相关文章

离线安装Cloudera Manager 5和CDH5(最新版5.1.3) 完全教程

原文  http://www.cnblogs.com/jasondan/p/4011153.html 关于CDH和Cloudera Manager CDH (Cloudera's Distribution, including Apache Hadoop),是Hadoop众多分支中的一种,由Cloudera维护,基于稳定版本的Apache Hadoop构建,并集成了很多补丁,可直接用于生产环境. Cloudera Manager则是为了便于在集群中进行Hadoop等大数据处理相关的服务安装和监控

离线安装Cloudera Manager 5.3

离线安装ClouderaManager 5.3   关于CDH和ClouderaManager CDH (Cloudera's Distribution, including Apache Hadoop),是Hadoop众多分支中的一种,由Cloudera维护,基于稳定版本的ApacheHadoop构建,并集成了很多补丁,可直接用于生产环境(本次项目环境使用了4个节点的CDH5.1.3版本). Cloudera Manager则是为了便于在集群中进行Hadoop等大数据处理相关的服务安装和监控管

离线安装Cloudera Manager5.3.4与CDH5.3.4(二)

Cloudera Manager Server和Agent都启动以后,就可以进行CDH5的安装配置了. 这时可以通过浏览器访问主节点的7180端口测试一下了(由于CM Server的启动需要花点时间,这里可能要等待一会才能访问),默认的用户名和密码均为admin. 制作本地源 先下载CDH到本地http://archive-primary.cloudera.com/cdh5/parcels/5.3.4/, 这里需要下载三样东西, 首先是与自己系统版本相对应的parcel包,然后是manifest

离线安装Cloudera Manager5.3.4与CDH5.3.4(一)

这几天一直在安装CDH,头都搞大了,安装第三次,终于成功了. 第一次问题很多,后面卸载了,由于没有卸载干净导致第二次安装失败.后来索性重装系统了,直接使用了纯净系统进行安装.一个人跑到学院机房去装系统,苦逼惨了. ,不扯了,记录下安装流程. 系统环境 操作系统:CentOS 6.5 x64,配置如下: Cloudera Manager:5.3.4 CDH: 5.3.4 前期准备工作(系统环境搭建) 所需软件 cloudera-manager-el6-cm5.3.4_x86_64.tar.gz m

CDH 5.x 离线安装 Cloudera

要配置生产环境前,最好严格按照官方文档/说明配置环境.比如,官方说这个安装包用于RETHAT6, CENTOS6,那就要装到6的版本下,不然很容易出现各种各样的错. 配置这个CDH5我入了很多坑,最重要的有2点 1. HP GEN9 DL60服务器装CentOS系统, 开始想装7的版本, 官方只说支持到6. 经过各种折腾确实装好了(后面会单开一章写服务器装CentOS7) 2. CDH暂不官方支持CentOS 7, 查到国外有人是安装成功了,但是会有各种小问题需要息解决. 如7带的是python

离线安装Cloudera Manager Express

-------------------------------- ###一.安装前提### 1. IP地址安排: #cat /etc/hosts 222.31.101.11 cdh5-nn1 222.31.101.13 cdh5-dn1 222.31.101.14 cdh5-dn2 222.31.101.16 cdh5-dn3 ###二.安装步骤### 1. 关闭防火墙并设为开机不启动 service iptables stop chkconfig iptables off 2. 设置selin

离线安装Cloudera Manager5.2.0和CDH5 2.0

第一次安装出现了各种问题,尤其是对于不是太熟悉linux系统的更是头疼不已呀!特此记录一下,希望能够让小伙伴们少走点弯路. 1.给机器添加路由 (根据自己的机器情况,可以忽略)   route add -net 172.17.2.0 netmask 255.255.255.0 gw 192.168.0.1 (windows)   route /p add 172.17.2.0 mask 255.255.255.0 192.168.0.1(linux)   2.集群主机配置 2.1 .配置静态 I

centos 7.2 离线安装 gcc

1.查看有没有挂载 centos 7.2 的镜像源文件 2.如果没有就通过服务端挂载 如果不知怎么挂载,就解压CentOS-7-x86_64-DVD-1511.iso 镜像文件,在Packages找到 所需要的rpm包,上传安装 3.运行命令 cd /run/media/root/CentOS\ 7\ x86_64/Packages/ -- 进入Packages rpm -ivh mpfr-3.1.1-4.el7.x86_64.rpm rpm -ivh libmpc-1.0.1-3.el7.x8

本地Yum软件源安装Cloudera Manager 5

本地Yum软件源安装Cloudera Manager 5 (非原创,转自http://blog.csdn.net/yangzhaohui168/article/details/30118175) Cloudera Manager 5(以下简称CM)默认采用在线安装的方式,给不能联互联网或者网络不畅的用户带来了不便,由于网络问题,屡装屡败的挫折感,让初次学习CDH用户真心体验到万事开头难.本文讲解了在CentOS 6环境下搭建本地Yum软件源,局域网内的用户在完全不连互联网的情况下,完成CM的安装