Hadoop集群初步搭建：

　　自己整理了一下Hadoop集群简易搭建的过程，感谢尚观科技贾老师的授课和指导！

基本环境要求：能联网电脑一台；装有Centos系统的VMware虚拟机；Xmanager Enterprise 5软件。

•规划集群的ip地址：（计划）

10.10.10.31-->uplooking01

10.10.10.32-->uplooking02

10.10.10.33-->uplooking03

•克隆2个虚拟机：（在VMware里操作）

右击将uplooking重命名为uplooking01；
打开uplooking01虚拟机，输入指令vim /etc/sysconfig/network-scripts/ifcfg-eth0 将IP地址设置为10.10.10.31
虚拟机系统管理->右键克隆->完整克隆->uplooking02、uplooking03

•配置克隆机主机名：（以下操作均可在XShell中进行！）

uplooking02和03机下分别输入指令vim /etc/sysconfig/network

将HOSTNAME改为uplooking02、uplooking03

•修改克隆机网络配置：

uplooking02和03机下分别输入指令vim /etc/sysconfig/network-scripts/ifcfg-eth0

删去HWADDR、UUID行；

IP地址行分别改为10.10.10.32、10.10.10.33。

•解决克隆机网卡名称变为eth1问题：

uplooking02和03机下分别输入指令rm -rf /etc/udev/rules.d/70-persistent-net.rules

重启reboot。

•配置物理机和虚拟机之间的映射：

C:\Windows\System32\drivers\etc\hosts 文件，添加并保存

10.10.10.31 uplooking01

10.10.10.32 uplooking02

10.10.10.33 uplooking03

•配置虚拟机之间的映射:

uplooking01、02和03机下分别输入指令vim /etc/hosts 添加并保存

10.10.10.31 uplooking01

10.10.10.32 uplooking02

10.10.10.33 uplooking03

•关闭防火墙：

关闭网络防火墙：service iptables stop

关闭防火墙的开机自启：chkconfig iptables off

关闭selinux（Linux访问权限管理系统）服务:vim /etc/selinux/config SELINUX=disabled

开启时间同步服务器:service ntpd start

设置时间同步服务器开机自启：chkconfig ntpd on

•uplooking01免密码登录到uplooking02与uplooking03

1>生成公钥和私钥 ssh-keygen -t rsa

2>把自己的公钥文件(~/.ssh/id_rsa.pub)追加到需要

免密码登录的主机的认证文件(~/.ssh/authorized_keys)中

ssh-copy-id [email protected]

scp ~/.ssh/authorized_keys

•安装jdk：

先查询本机是否安装了jdk如果安装了先卸载：rpm -qa | grep jdk

查看当前Java版本： java -version

在uplooking01上进行操作：

①mkdir /software （在/目录下创建software文件夹）

②上传jdk的安装包到linux主机下的的 /software （Ctrl+Alt+F新建文件传输）

③tar -zxvf jdk-8u172-linux-x64.tar.gz -C /opt/ （解压安装包，先cd进software）

④mv jdk1.8.0_172/ jdk （重命名为jdk）

⑤配置环境变量

vim /etc/profile添加

export JAVA_HOME=/opt/jdk

export PATH=$PATH:$JAVA_HOME/bin

⑥使环境变量立刻生效

source /etc/profile

⑦远程发送uplooking01上已安装好的jdk和环境变量的配置

scp -r /opt/jdk [email protected]:/opt

scp /etc/profile [email protected]:/etc/

•安装mysql用于存储元信息：

在uplooking03操作：

首先查看是否安装了mysql,如果安装了先卸载：

rpm -qa|grep mysql

rpm -e mysql-libs-5.1.71-1.el6.x86_64 --nodeps

yum -y install mysql-server

service mysqld start

登录到mysql: mysql -uroot –p

修改mysql的密码: set password=password("root")

修改权限:

use mysql

delete from

delete from user where password = ‘‘;

update user set host=‘%‘ ;

flush privileges;

设置/proc/sys/vm/swappiness为0：（三台虚拟机都做）

vim /etc/sysctl.conf 添加并保存 vm.swappiness=0

重启或激活：sysctl –p

•关闭THP(所有机器都做)：

透明大页的开启，同样会消耗掉大量的内容，（包括HDP和CDH）建议将其关闭，添加进/etc/rc.local

echo never>/sys/kernel/mm/redhat_transparent_hugepage/defrag

echo never >/sys/kernel/mm/redhat_transparent_hugepage/enabled

echo never>/sys/kernel/mm/transparent_hugepage/enabled

echo never > /sys/kernel/mm/transparent_hugepage/defrag

好啦！这样一个简单的集群就搭好啦~~

原文地址：https://www.cnblogs.com/kaml8/p/9517638.html

时间： 2024-10-01 06:32:59

Hadoop集群初步搭建：的相关文章

大数据 -- Hadoop集群环境搭建

首先我们来认识一下HDFS, HDFS(Hadoop Distributed File System )Hadoop分布式文件系统.它其实是将一个大文件分成若干块保存在不同服务器的多个节点中.通过联网让用户感觉像是在本地一样查看文件,为了降低文件丢失造成的错误,它会为每个小文件复制多个副本(默认为三个),以此来实现多机器上的多用户分享文件和存储空间. Hadoop主要包含三个模块: HDFS模块:HDFS负责大数据的存储,通过将大文件分块后进行分布式存储方式,突破了服务器硬盘大小的限制,解决了单

Hadoop集群环境搭建

(1).在虚拟机中设置静态主机IP ①.获取当前IP地址的网段②.子网掩码以及网关 ③.在虚拟机外部将其Ping通 (2).修改主机名临时修改 hostname 主机名称永久修改 sudo vi /etc/sysconfig/network 文件修改hostname属性 (权限不够时可以通过su root -->sudo vi /etc/sudoers添加权限,如下) (3).关闭防火墙查看防火墙运行状态 sudo service iptables status 临时关闭防火墙 sudo

一个Hadoop集群上搭建多个Hbase集群

即不同的集群在hdfs上建立不同的根目录和Zooeekper的根目录.如图所示:原来的hbase-0.94.14版本中在hdfs上目录是hbase, zookeeper的根目录是zookeeper_data.hbase-0.96.8版本中在hdfs上目录是index,zookeeper的根目录是zookeeper_data_inidex.

hadoop集群的搭建

1.安装虚拟机 2.虚拟机上安装centos7作为hadoop的主节点 1)修改主机名 vim /etc/hostname 清空里里面的内容;然后填写master 2)修改hosts vim /etc/hosts 内容如下: 127.0.0.1 localhost localhost.localdomain localhost4 localhost4.localdomain4 ::1 localhost localhost.localdomain localhost6 localhost6.lo

Hadoop集群大数据平台搭建

Hadoop集群环境搭建配置前言 Hadoop的搭建分为三种形式:单机模式.伪分布模式.完全分布模式,只要掌握了完全分布模式,也就是集群模式的搭建,剩下的两种模式自然而然就会用了,一般前两种模式一般用在开发或测试环境下,Hadoop最大的优势就是分布式集群计算,所以在生产环境下都是搭建的最后一种模式:完全分布模式. 硬件选择须知: 分布式环境中一个服务器就是一个节点节点越多带来的是集群性能的提升一个Hadoop集群环境中,NameNode,SecondaryNameNode和DataNo

大数据系列（3）——Hadoop集群完全分布式坏境搭建

前言上一篇我们讲解了Hadoop单节点的安装,并且已经通过VMware安装了一台CentOS 6.8的Linux系统,咱们本篇的目标就是要配置一个真正的完全分布式的Hadoop集群,闲言少叙,进入本篇的正题. 技术准备 VMware虚拟机.CentOS 6.8 64 bit 安装流程我们先来回顾上一篇我们完成的单节点的Hadoop环境配置,已经配置了一个CentOS 6.8 并且完成了java运行环境的搭建,Hosts文件的配置.计算机名等诸多细节. 其实完成这一步之后我们就已经完成了Had

Spark集群框架搭建【VM15+CentOS7+Hadoop+Scala+Spark+Zookeeper+HBase+Hive】

目录 1 目的 2 准备工作 3 安装过程 3.1 在虚拟机中安装CentOS7 3.1.1 虚拟机设置 3.1.2 安装Linux系统 3.2 JAVA环境 3.2.1 卸载Linux自带的jdk 3.2.2 下载并安装最新版本的jdk 3.2.3 环境变量设置 3.3 SSH免密登陆 3.3.1 准备工作 3.3.2 设置免密登陆 3.4 Hadoop2.7.2安装及集群配置 3.4.1 Hadoop安装 3.4.2 伪分布式集群配置 3.4.3 启动hadoop 3.5 Spark安装及环

大数据系列（2）——Hadoop集群坏境CentOS安装

前言前面我们主要分析了搭建Hadoop集群所需要准备的内容和一些提前规划好的项,本篇我们主要来分析如何安装CentOS操作系统,以及一些基础的设置,闲言少叙,我们进入本篇的正题. 技术准备 VMware虚拟机.CentOS 6.8 64 bit 安装流程因为我的笔记本是Window7操作系统,然后内存配置,只有8G,内存配置太低了,当然为了演示,我会将Hadoop集群中的主节点分配2GB内存,然后剩余的三个节点都是1GB配置. 所有的节点存储我都设置为50GB. 在安装操作系统之前,我们需要