ambari 搭建hadoop大数据平台系列2-客户机配置

本案例搭建的环境介绍如下：Ambari 2.4.2 + HDP 2.5 （hadoop 2.7 ；hive 1.2 ；Tez ；Spark 2.0）+jdk1.8.25 +centos7.0,这里首先要关注些注意事项，至于为什么会一一说明。

第一部分：注意事项：

版本必须低于7.2

selinux 必须关闭

firewalld 必须关闭

127.0.0.1 hosts该条记录删除

本地仓库必须搭建

root 账户ssh 启用

指定hdfs data 目录

安装jdk1.8.0

所有机器时间必须同步

1:版本必须低于7.2,这里踩了个大坑，刚开始选用了7.3，最后发现经常莫名其妙的异常，经常安装失败。后来从官方查到（没有放在最显眼的位置说明）：

2. 127.0.0.1 hosts该条记录删除，这也是在埋坑过后发现的

3.本地仓库必须搭建，如果不搭建本地仓库，太痛苦了。下载过程巨慢，而且每次重新来的时候，巨费时间。

4.root 账户ssh 启用这个我也考虑过使用专门账户，虽然ambari 也支持该功能，但是需要做相应的很多更改，如果是测试机版本，还是便捷点比较好，后期可以通过ambari 的相关安全策略来补上。

5.其他的几项注意事项，大家一看就懂的，不过还是得细心检查比较好。否则后面的拍错过程会费掉很多精力

第二部分：开始配置客户端及ambari-server

1.集群端机器分配如下：

centos7.0	10.1.11.1	hadoop11-1
centos7.0	10.1.11.2	hadoop11-2
centos7.0	10.1.11.3	hadoop11-3
centos7.0	10.1.11.4	hadoop11-4
centos7.0	10.1.11.5	hadoop11-5
centos7.0	10.1.11.6	hadoop11-6
centos7.0	10.1.11.7	hadoop11-7

2.检查 centos 版本，关闭selinux ,firewalld , 添加hosts 记录，安装jdk1.8，

检查时区和时间是否统一

yum install ntp

cp /usr/share/zoneinfo/Asia/Shanghai /etc/localtime

配置root ssh 登陆

配置jdk1.8.025 ，将jdk 解压到/usr/local/java/jdk1.8.0_112目录：

/etc/profile 文件末尾添加

#add jdk-8u112

##add for jdk

export JAVA_HOME=/usr/local/java/jdk1.8.0_112

export CLASSPATH=$JAVA_HOME/lib:$JAVA_HOME/jre/lib:$JAVA_HOME/lib/tools.jar

export PATH=$JAVA_HOME/bin:$JAVA_HOME/jre/bin:$PATH

配置hosts 文件

cat /etc/hosts

10.1.11.32 localRepository-11-32

10.1.11.10 ambari-11-10

10.1.11.1 hadoop11-1

10.1.11.2 hadoop11-2

10.1.11.3 hadoop11-3

10.1.11.4 hadoop11-4

10.1.11.5 hadoop11-5

10.1.11.6 hadoop11-6

10.1.11.7 hadoop11-7

如上，客户机的相关准备工作已经都检查完毕。下一步骤，先搭建本地仓库，以便下载。

时间： 2024-12-22 04:08:05

ambari 搭建hadoop大数据平台系列2-客户机配置的相关文章

ambari 搭建hadoop大数据平台系列4-配置ambari-server

ambari 搭建hadoop大数据平台系列4-配置ambari-server,分为三部分: 官网: https://docs.hortonworks.com/HDPDocuments/Ambari-2.4.2.0/bk_ambari-installation/content/download_the_ambari_repo_lnx7.html 安装ambari-server 配置ambari-server 命令;ambari-server setup 启动ambari-server 命令

ambari 搭建hadoop大数据平台系列1-概述

最近要为第三方搭建一套大数据平台,中间先进行了虚拟机版本,测试通过后,进行了物理机版本的生产环境,网上关于ambari 的文章并不多,但好在ambari 官方文档质量略高,社区比较活跃,便整理该系列的文档,将埋掉的坑抛出来,帮助小伙伴们更加快速的搭建自己的hadoop 平台. 分三个部分: 1. 为什么选择ambari 来搭建说到ambari, 主要的对手cloudrea manager ,大家比较熟悉,至于各自长短,优势劣汰,大家自己斟酌选择啦. Cloudera Manager is di

ambari 搭建hadoop大数据平台系列3-搭建本地仓库

1.官方参考 https://docs.hortonworks.com/HDPDocuments/Ambari-2.4.2.0/bk_ambari-installation/content/setting_up_a_local_repository_with_no_internet_access.html 2.本地实例 10.1.11.32 localRepository-11-32 下载路径:记得下载后md5校验,下载时间很长. HDP: http://public-repo-1.hort

ambari 搭建hadoop大数据平台系列6-验证测试

web 检查组件服务是否正常启动 shell 端检查服务是否健康 hdfs fsck / -files -blocks -locations java api/ python 检查服务是否正常

hadoop大数据平台安全基础知识入门

概述以 Hortonworks Data Platform (HDP) 平台为例 ,hadoop大数据平台的安全机制包括以下两个方面: 身份认证即核实一个使用者的真实身份,一个使用者来使用大数据引擎平台,这个使用者需要表明自己是谁,即提供自己的身份证明,大数据平台需要检验这个证明,确定这个证明是有效的,且不是伪造的.否则,就拒绝这个使用者进入大数据引擎. 授权管理这个使用者的真实身份核实之后,需要对这个使用者的使用权限进行界定,即这个使用者在大数据平台中能够使用什么组件,能够获取哪些资源,

数据仓库和Hadoop大数据平台有什么差别？

广义上来说,Hadoop大数据平台也可以看做是新一代的数据仓库系统, 它也具有很多现代数据仓库的特征,也被企业所广泛使用.因为MPP架构的可扩展性,基于MPP的数据仓库系统有时候也被划分到大数据平台类产品. 但是数据仓库和Hadoop平台还是有很多显著的不同.针对不同的使用场景其发挥的作用和给用户带来的体验也不经相同.用户可以根据下表简单判断什么场景更适合用什么样的产品. 数据仓库和Hadoop大数据平台特性比较特性 Hadoop Data Warehouse 计算节点数可到数千个一般在

hadoop大数据平台架构之DKhadoop详解

hadoop大数据平台架构之DKhadoop详解大数据的时代已经来了,信息的爆炸式增长使得越来越多的行业面临这大量数据需要存储和分析的挑战.Hadoop作为一个开源的分布式并行处理平台,以其高拓展.高效率.高可靠等优点越来越受到欢迎.这同时也带动了hadoop商业版的发行.这里就通过大快DKhadoop为大家详细介绍一下hadoop大数据平台架构内容.目前国内的商业发行版hadoop除了大快DKhadoop以外还有像华为云等.虽然发行方不同,但在平台架构上相似,这里就以我比较熟悉的dkhadoo

大数据平台CDH6.1.0 安装配置

大数据平台 CDH6.1.0 安装配置标签(空格分隔): 大数据平台构建一: 关于CDH6.1.0 的介绍二: 系统环境初始化三: 安装CDH6.1.0所需环境四: 配置CDH6.1.0的cloudera-manager安装一:关于CDH6.1.0 的介绍 Cloudera在前天12月19日,对外宣布正式发布Cloudera Enterprise 6.1包含大数据生态版本如下: 1.组件版本:Kafka 2.0, Spark 2.4, HBase 2.1.1, Accumulo 1.

Cloudera hadoop 大数据平台实战指南（1）

大数据主要具有四方面的典型特征-- 规模性( Volume). 多样性( Variety). 高速性( Velocity) 和价值性( Value), 即所谓的" 4V". 大数据时代的关键技术:(1) 大数据采集技术(2) 大数据预处理技术(3) 大数据存储及管理技术(4) 大数据分析及挖掘技术(5) 大数据可视化展现技术什么是hadoop?Hadoop 最初是开始于 2002 年的 Apache 的 Nut