大数据平台CDH6.1.0 安装配置

大数据平台 CDH6.1.0 安装配置

标签(空格分隔): 大数据平台构建


  • 一: 关于CDH6.1.0 的介绍
  • 二: 系统环境初始化
  • 三: 安装CDH6.1.0所需环境
  • 四: 配置CDH6.1.0的cloudera-manager安装

一:关于CDH6.1.0 的介绍

Cloudera在前天12月19日,对外宣布正式发布Cloudera Enterprise 6.1包含大数据生态版本如下:
1.组件版本:Kafka 2.0, Spark 2.4, HBase 2.1.1, Accumulo 1.9.2, SOLR 7.4
2.CDH免费版限制100个节点内
3.HDFS的纠删码完全支持,包括Hive,Navigator(auditing),BDR,MR,Spark
4.对象存储支持:On-prem (Ceph), Cloud (ADLS gen 2)
5.Impala的多个distinct语句支持
6.Sqoop的HiveServer2与导入Parquet文件支持
7.OpenJDK支持

##二:系统环境初始化

2.1: 系统环境介绍

系统:CentOS7.5X64

cat /etc/hosts 

192.168.20.111  NN01.yl.com    NN01
192.168.20.112  SN01.yl.com    SN01
192.168.20.113  DN01.yl.com    DN01
192.168.20.114  DN02.yl.com    DN02

2.2:无密钥登录配置

做root用户无密钥认证

 ssh-keygen ---一直敲回车到最后

 cat id_rsa.pub >> authorized_keys 

 将所有的公钥导入authorized_keys  分发到 所有的 机器的.ssh/ 下面

 然后测试

2.3:关闭 firewalld,iptables 与 selinux

所有节点都要配置:

yum install -y firewall* iptable* 

  (1) 关闭firewalld

 systemctl stop firewalld.service
 systemctl disable firewalld.service
 firewall-cmd --state

 (2) 关闭iptables
 iptables -F
 systemctl stop iptables.service
 service iptables save
 systemctl disable iptables.service 

 (3) 禁用 selinux 

  sed -i ‘/SELINUX/s/enforcing/disabled/‘ /etc/selinux/config
  setenforce 0
  getenforce 0
  sestatus

  重启机器

  reboot

2.4:所有机器更改CentOS7.5x64的文件句柄数

vim /etc/security/limits.conf
---

*               soft    nofile          65535
*               hard    nofile          1029345
*               soft    nproc           unlimited
*               hard    nproc           unlimited
*               soft    memlock         unlimited
*               hard    memlock         unlimited


在其它 节点上面执行命令:

rsync -arvzP root@192.168.20.111:/etc/security/limits.conf /etc/security/

同步limits.conf  文件

2.5 时间同步:

所有机器 yum install chrony*
1. NN01.yl.com:

vim /etc/chrony.conf 增加
----
注释掉相关默认的server
server ntp1.aliyun.com iburst

allow 192.168.20.111/16

service chronyd start
chkconfig chronyd on 

2. SN01.yl.com---DN01.yl.com 同步NN01.yl.com

vim /etc/chrony.conf
----
注释掉默认的server
server 192.168.20.111 iburst
----

service chronyd stop
service chronyd start
chkconfig chronyd on

2.6: cdh6.1.0 安装所需文件下载

cdh6.1.0 离线包:
CDH-6.1.0-1.cdh6.1.0.p0.770702-el7.parcel
CDH-6.1.0-1.cdh6.1.0.p0.770702-el7.parcel.sha256
manifest.json

下载: https://archive.cloudera.com/cdh6/6.1.0/parcels/

cdh6 的CM 包:
cloudera-manager-agent-6.1.0-769885.el7.x86_64.rpm
cloudera-manager-daemons-6.1.0-769885.el7.x86_64.rpm
cloudera-manager-server-6.1.0-769885.el7.x86_64.rpm
cloudera-manager-server-db-2-6.1.0-769885.el7.x86_64.rpm
oracle-j2sdk1.8-1.8.0+update141-1.x86_64.rpm
allkeys.asc

下载地址:

https://archive.cloudera.com/cm6/6.1.0/redhat7/yum/RPMS/x86_64/

jdbc 驱动:
mysql-connector-java-8.0.15-1.el7.noarch.rpm

下载:mysql官网下载

2.7:安装jdk

所用大数据节点都要配置:jdk 

rpm -ivh oracle-j2sdk1.8-1.8.0+update141-1.x86_64.rpm

vim /etc/profile

---
export JAVA_HOME=/usr/java/jdk1.8.0_141-cloudera
export CLASSPATH=.:$JAVA_HOME/jre/lib:$JAVA_HOME/lib:$JAVA_HOME/lib/tools.jar
PATH=$PATH:$HOME/bin:$JAVA_HOME/bin
---
source /etc/profile 

java -version

2.8 安装mariadb-server

yum install -y mariadb-server 

service mariadb start

chkconfig mariadb on 

mysql_secure_installation

mysql -uroot -pQingchun123.com

2.9配置 httpd 分发服务器

NN01.yl.com:

yum install -y httpd 

vim /etc/httpd/conf/httpd.conf
----
修改/etc/httpd/conf/httpd.conf配置文件,在<IfModule mime_module>中修改以下内容

AddType application/x-gzip .gz .tgz .parcel
----
service httpd start
chkconfig httpd start

做CM6.1 的 分发源

yum install -y createrepo

cd /root/cm6.1/
createrepo .

mv /root/cm6.1/ /var/www/html/
mv /root/cdh6.1/ /var/www/html/

vim /etc/yum.repos.d/cm.repo

------
[cmrepo]
name = cm_repo
baseurl =http://192.168.20.111/cm6.1
enable = true
gpgcheck = false

-----
yum makecache 

所有主机执行命令同步:
rsync -avrzP root@192.168.20.111:/etc/yum.repos.d/cm.repo /etc/yum.repos.d/

yum makecache 

2.10 配置mysql-jdbc

rpm -ivh mysql-connector-java-8.0.15-1.el7.noarch.rpm

cd /usr/share/java/

cp -p mysql-connector-java-8.0.15.jar  mysql-connector-java.jar

三: 安装CDH6.1所需环境

3.1:安装所需依赖包

所有大数据节点都要安装:

yum -y install chkconfig python bind-utils psmisc libxslt zlib sqlite cyrus-sasl-plain cyrus-sasl-gssapi fuse fuse-libs redhat-lsb postgresql* portmap mod_ssl openssl-devel python-psycopg2 MySQL-python

3.2 安装cloudera-server

yum install -y cloudera-manager-server

3.3 在 mysql 当中创建 CM 需要的注册库

# mysql -uroot -pQingchun123.com
mysql> create database cmf character set utf8;
mysql> grant all privileges on cmf.* to ‘cmf‘@‘%‘ identified by ‘cmf_1234‘ with grant option;
mysql> grant all privileges on cmf.* to ‘cmf‘@‘NN01.yl.com‘ identified by ‘cmf_1234‘ with grant option;

mysql> flush privileges;

3.4 注入CM-server库 与 CM-agent端的server

/opt/cloudera/cm/schema/scm_prepare_database.sh mysql cmf cmf cmf_1234

四: 配置CDH6.1的cloudera-manager安装

4.1 安装启动CM

service cloudera-scm-server start
cd /var/log/cloudera-scm-server/
tail -f cloudera-scm-server.log

选择更多parcel

所有节点执行:

echo vm.swappiness = 10 >> /etc/sysctl.conf
 echo 10 >  /proc/sys/vm/swappiness
echo never > /sys/kernel/mm/transparent_hugepage/defrag
echo never > /sys/kernel/mm/transparent_hugepage/enabled

将下面 两条命令 

mysql 授权的配置

数据库授权:
mysql -uroot -pQingchun123.com
---
创建hive 所需要的库并授权:
mysql >create database cdh_hive default character set latin1;
字符必须为拉丁(latin1),如果uft8可能会报错Specified key was too long; max key length is 767 bytes
mysql >grant all privileges on cdh_hive.* to ‘hive‘@‘%‘ identified by ‘Hive_123‘ with grant option;
mysql >grant all privileges on cdh_hive.* to ‘hive‘@‘NN01.yl.com‘ identified by ‘Hive_123‘ with grant option;
mysql >flush privileges; 

创建oozie 所需要的库
mysql >create database cdh_oozie default character set utf8;
mysql >grant all privileges on cdh_oozie.* to ‘oozie‘@‘%‘ identified by ‘Oozie_123‘ with grant option;
mysql >grant all privileges on cdh_oozie.* to ‘oozie‘@‘NN01.yl.com‘ identified by ‘Oozie_123‘ with grant option;
mysql >flush privileges; 

创建hue所需要的库:
mysql >create database cdh_hue default character set utf8;
mysql >grant all privileges on cdh_hue.* to ‘hue‘@‘%‘ identified by ‘Hue_123‘ with grant option;
mysql >grant all privileges on cdh_hue.* to ‘hue‘@‘NN01.yl.com‘ identified by ‘Hue_123‘ with grant option;
mysql >flush privileges; 

创建CM 的 监控端Activity Monitor 的库
Activity Monitor:
mysql >create database cdh_am default character set utf8;
mysql >grant all privileges on cdh_am.* to ‘am‘@‘%‘ identified by ‘Am_123‘ with grant option;
mysql >grant all privileges on cdh_am.* to ‘am‘@‘NN01.yl.com‘ identified by ‘Am_123‘ with grant option;
mysql >flush privileges;

创建RM 的 监控端 Reports Manager 的库
Reports Manager
mysql >create database cdh_rm default character set utf8;
mysql >grant all privileges on cdh_rm.* to ‘rm‘@‘%‘ identified by ‘Rm_123‘ with grant option;
mysql >grant all privileges on cdh_rm.* to ‘rm‘@‘NN01.yl.com‘ identified by ‘Rm_123‘ with grant option;
mysql >flush privileges;


原文地址:http://blog.51cto.com/flyfish225/2350742

时间: 2024-11-06 15:58:47

大数据平台CDH6.1.0 安装配置的相关文章

大数据平台HDP-2.6.4安装与配置

大数据平台HDP-2.6.4 安装 与配置 标签(空格分隔): 大数据平台构建 一: 关于HDP的介绍 二: 系统环境介绍 三: 系统环境初始化 四: 安装HDP-2.6.4平台 五: 启用NameNode HA 与 YARN HA 一:关于HDP的介绍 1.1:hdp 是什么 HDP全称叫做Hortonworks Data Platform. Hortonworks数据平台是一款基于Apache Hadoop的是开源数据平台,提供大数据云存储,大数据处理和分析等服务.该平台是专门用来应对多来源

开发人员学Linux(14):CentOS7安装配置大数据平台Hadoop2.9.0

1.前言 "大云物移"是当年很火热的一个话题,分别指大数据.云计算.物联网和移动互联网,其中大数据领域谈论得多就是Hadoop.当然Hadoop不代表大数据,而是大数据处理领域的一个比较有名的开源框架而已,通常说的大数据包含了大数据的存放.大数据的分析处理及大数据的查询展示,本篇提到的Hadoop只不过是在其中的大数据的分析处理环节起作用,Apache提供了一个开源全家桶,包括了Hadoop.HBase.Zookeeper.Spark.Hive及Pig等一些框架.不过限于篇幅,本篇只介

ambari 搭建hadoop大数据平台系列2-客户机配置

本案例搭建的环境介绍如下:Ambari 2.4.2 + HDP 2.5 (hadoop 2.7 :hive 1.2 :Tez :Spark 2.0)+jdk1.8.25 +centos7.0,这里首先要关注些注意事项,至于为什么会一一说明. 第一部分:注意事项: 版本必须低于7.2 selinux 必须关闭 firewalld 必须关闭 127.0.0.1  hosts该条记录删除 本地仓库必须搭建 root 账户ssh 启用 指定hdfs data 目录 安装jdk1.8.0 所有机器时间必须

大数据平台CDH5.14.2 的安装配置

大数据平台CDH5.14.2 的安装配置 标签(空格分隔): 大数据平台构建 一:系统环境初始化 二:安装CDH5.14.2 平台 三:分配主机与分配角色 一: 系统环境初始化 1.1: 系统环境介绍 系统: CentOS7.5X64 cat /etc/hosts --- 172.17.100.11 node-01.flyfish 172.17.100.12 node-02.flyfish 172.17.100.13 node-03.flyfish 172.17.100.14 node-04.f

CentOS7部署CDH6.0.1大数据平台

Cloudera版本(Cloudera’s Distribution Including Apache Hadoop,简称“CDH”),基于Web的用户界面,支持大多数Hadoop组件,包括HDFS.MapReduce.Hive.Spark. Hbase.Zookeeper.Sqoop等,简化了大数据平台的安装.使用难度.本文档将演示CDH6.0.1的部署,该版本是目前最新版本,该版本Hadoop生态组件版本可以查看manifest.json文件,相关文件下载地址如下: https://arch

大数据平台一键安装OS【定制化OS镜像制作】

 定制化 大数据平台一键安装OS 大数据平台一键安装OS系列 大数据平台一键安装OS[搭建脚本篇] 定制化OS镜像制作 1.操作环境 操作环境:VMware Workstarion 9 and vSphere client 系统:CentOS -6.8-x86_64 工具:gconf-editor anaconda repodata createrepo mkisofs rsync 2.主要思路 定制化是通过kickstart脚本来实现的,linux系统安装完毕后在root目录下会生成anaco

大数据平台一键安装OS【搭建脚本篇】

定制化大数据平台一键安装OS 大数据平台一键安装OS系列 大数据平台一键安装OS[定制化OS镜像制作] 搭建脚本篇 脚本命名随便,只要能看懂就行 镜像包说明 os1.1.iso 用于安装服务端和客户端操作系统 hdp.iso 用于安装hdp服务 1.架构图: 服务端 客户端 2.原理分析 安装系统-安装本地yum源-安装http源-安装并配置ntp服务-配置秘钥-安装jdk-安装mysql-编译安装ambari平台 3.服务端脚本分析 (1)create_local_yum.sh #安装本地yu

大数据平台CDH搭建学习(5.10.0)

又是一个周末,本来是已经打开wegame,更新一下许久未碰的lol,后来实在等不下去了,还是想想写写博客,正好最近也在学习CDH:刚刚就像女生买东西一样,毫不犹豫地买了3个云主机,好了,废话不多说,下面我们正式开始CDH搭建大数据平台. 一.Hadoop是什么? Hadoop是一个分布式系统架构,由Apache基金会开发.用户可以在不理解分布式底层细节的情况下,开发分布式程序,充分利用集群的威力高速运算和存储. 不足之处:①版本管理混乱 ②部署过程繁琐,升级过程复杂 ③兼容性差 ④安全性低 二.

ambari 搭建hadoop大数据平台系列4-配置ambari-server

ambari 搭建hadoop大数据平台系列4-配置ambari-server,分为三部分: 官网:  https://docs.hortonworks.com/HDPDocuments/Ambari-2.4.2.0/bk_ambari-installation/content/download_the_ambari_repo_lnx7.html 安装ambari-server  配置ambari-server  命令;ambari-server setup 启动ambari-server 命令