centos7搭建伪分布式集群

centos7搭建伪分布式集群

需要

　　centos7虚拟机一台；

　　jdk-linux安装包一个

　　hadoop-2.x安装包1个（推荐2.7.x）

一、设置虚拟机网络为静态IP（最好设成静态，为之后编程提供方便，不设置静态ip也可以）

1、进入网络配置查看ip

2、选择NAT模式链连接

3、点击NAT设置，记住网关IP，后面要用到

4、进入终端，输入命令： cd /etc/sysconfig/network-scripts,然后 vim ./ifcfg-eth0,（有的虚拟机是文件是：ifcfg-ens33）并进行如下设置，

【IPADDR为静态ip地址，格式必须与网关IP的前三位一样：192.168.13.X】 X在1-255之间

GATWAY是之前记得的网关IP.

其他的如图所示。

5、重启网络服务：service network restart

6、网络测试：ping网关，ping外网。都能ping通表示网络正常，大功告成（前提主机联网）

成功标志如图：

二、配置ssh免密登录（开启集群服务时不必每次都输入密码）

　　1、命令：ssh-keygen 一路回车。遇到overwrite(覆盖写入)输入y

　　2、将生成的密钥发送到本机地址：ssh-copy-id localhost

　　3、测试是否可以免密登录。出现下图解果就OK;

三、安装java环境（jdk）

1、卸载虚拟机自带的dk;　

　　确定JDK版本

　　rpm –qa | grep jdk

　　rpm –qa | grep gcj

　　切换到root用户，根据结果卸载java

　　yum -y remove java-1.8.0-openjdk-headless.x86_64

　　yum -y remove java-1.7.0-openjdk-headless.x86_64

2、测试jdk是否卸载干净 java -version

3、安装jdk.

　　将jdk-linux-xxx解压到某一个文件夹（记好路径，不要有中文）

　　通过pwd命令查看当前路径

4、配置环境变量

　　在root用户下，将/etc/profile的权限赋给普通用户：chown -R zck:zck /etc/profile (zck是我的普通用户名，不然普通用户无法修改环境变量)

　　转到普通用户(zck)下，修改环境变量：vim /etc/profile （注意自己的jdk路径）

#java

export JAVA_HOME=/home/hadoop/app/jdk1.8.0_141

export JAVA_JRE=JAVA_HOME/jre

export CLASSPATH=.:$JAVA_HOME/lib:$JAVA_JRE/lib

export PATH=$PATH:$JAVA_HOME/bin

5、保存退出，并使/etc/profile文件生效：source /etc/profile

6、测试jdk环境：java -version

四、安装hadoop

　　1、解压hadoop(同jdk)

　　2、配置环境变量(基本步骤与jdk一样)。

#hadoop
export HADOOP_HOME=/home/zck/software/hadoop
export PATH=$PATH:$HADOOP_HOME/bin:$HADOOP_HOME/sbin

3、测试(保存之后要source /etc/profile 不然环境变量修改不生效)

五、搭建伪分布式

修改6个配置文件

进入文件目录 ../hadoop/etc/hadoop

1、修改core-site.xml配置文件 (建议将localhost修改为你之前设置的静态ip)

<name>fs.defaultFS</name>

<value>hdfs://localhost:9000</value>

</property>

<name>hadoop.tmp.dir</name>

</property>

<name>hadoop.proxyuser.hadoop.hosts</name>

</property>

<name>hadoop.proxyuser.hadoop.groups</name>

</property>

</configuration>

2、修改hdfs-site.xml配置文件

<name>dfs.namenode.name.dir</name>

</property>

<name>dfs.datanode.data.dir</name>

</property>

<name>dfs.replication</name>

</property>

<name>dfs.permissions</name>

<value>false</value>

</property>

</configuration>

3、修改hadoop-env.sh配置文件（改成jdk位置）

4、修改mapred-site.xml.template配置文件（先重命名为mapred-site.xml）

<name>mapreduce.frameword.name</name>

</property>

</configuration>

5、修改yarn-site.xml配置文件

<name>yarn.nodemanager.aux-servies</name>

<value>mapreduce_shuffle</value>

</property>

</configuration>

使修改生效，命令：sourec /etc/profile

6、格式化namenode

切回到hadoop目录，输入如下命令：bin/hdfs namenode -format

启动hadoop伪分布式集群：sbin/start-all.sh

启动完毕输入jps查看

原文地址：https://www.cnblogs.com/2016-zck/p/11449333.html

时间： 2024-10-23 01:46:49

centos7搭建伪分布式集群的相关文章

hadoop-2.9.2搭建伪分布式集群

准备4台机器分别为node1 node2 node3 node5 1.第一台node1 1.修改固定IP 2.修改主机名 3.添加与其他机器的映射 2.第二台机器通过克隆复制多个,按上面的配置进行配置 3.免密登录假如node1需要免密登录到node2 node3 node5 在node1的机器上执行 ssh-keygen -t rsa 生成的秘钥文件在root/.ssh目录下在node1上把生成的公钥给其他node2 node3 node5 在其他机器上执行

Hadoop伪分布式集群搭建-此文章在个人51.cto转载

一.HDFS伪分布式环境搭建 Hadoop分布式文件系统(HDFS)被设计成适合运行在通用硬件(commodity hardware)上的分布式文件系统.它和现有的分布式文件系统有很多共同点.但同时,它和其他的分布式文件系统的区别也是很明显的.HDFS是一个高度容错性的系统,适合部署在廉价的机器上.HDFS能提供高吞吐量的数据访问,非常适合大规模数据集上的应用.HDFS放宽了一部分POSIX约束,来实现流式读取文件系统数据的目的.HDFS在最开始是作为Apache Nutch搜索引擎项目的基础架

hadoop伪分布式集群搭建与安装（ubuntu系统）

1:Vmware虚拟软件里面安装好Ubuntu操作系统之后使用ifconfig命令查看一下ip; 2:使用Xsheel软件远程链接自己的虚拟机,方便操作.输入自己ubuntu操作系统的账号密码之后就链接成功了: 3:修改主机的名称vi /etc/hostname和域名和主机映射对应的关系 vi /etc/hosts,改过之后即生效,自己可以ping一下,我这里ip对应master,比如ping master之后发现可以ping通即可: 4:修改过主机名称和主机名与ip对应的关系之后:开始上传jd

ZooKeeper的伪分布式集群搭建以及真分布式集群搭建

zk集群的一些基本概念 zookeeper集群搭建: zk集群,主从节点,心跳机制(选举模式) 配置数据文件 myid 1/2/3 对应 server.1/2/3 通过 zkCli.sh -server [ip]:[port] 命令检测集群是否配置成功和其他大多数集群结构一样,zookeeper集群也是主从结构.搭建集群时,机器数量最低也是三台,因为小于三台就无法进行选举.选举就是当集群中的master节点挂掉之后,剩余的两台机器会进行选举,在这两台机器中选举出一台来做master节点.而当原

ZooKeeper的伪分布式集群搭建

ZooKeeper集群的一些基本概念 zookeeper集群搭建: zk集群,主从节点,心跳机制(选举模式) 配置数据文件 myid 1/2/3 对应 server.1/2/3 通过 zkCli.sh -server [ip]:[port] 命令检测集群是否配置成功和其他大多数集群结构一样,zookeeper集群也是主从结构.搭建集群时,机器数量最低也是三台,因为小于三台就无法进行选举.选举就是当集群中的master节点挂掉之后,剩余的两台机器会进行选举,在这两台机器中选举出一台来做maste

Hadoop伪分布式集群搭建总结

Hadoop伪分布式集群搭建总结一.所需软件VMware15!CentOS6.5JDK1.8Hadoop2.7.3二.安装注意:对文件进行编辑:输入a,表示对该文件进行编辑,最后保存该文件,操作为:点击键盘上的Esc按钮,然后输入英文的:字符,再输入wq,点击回车,完成文件的保存.1.关闭防火墙和禁用SELINUX(1).永久关闭防火墙,重启Linux系统(2) .禁用SELINUX:修改文件参数重启Linux使其生效(3).检查防火墙是否运行,显示下图即为关闭2.配置hostname与IP

ZooKeeper伪分布式集群安装

获取ZooKeeper安装包下载地址:http://apache.dataguru.cn/zookeeper 选择一个稳定版本进行下载,我这里下载的是zookeeper-3.4.6版本. ZooKeeper伪分布式集群安装伪分布式集群:在一台Server中,启动多个ZooKeeper的实例. 上传并解压安装包 cd /usr rz -by tar xf zookeeper-3.4.6.tar.gz 创建实例配置文件 cd zookeeper-3.4.6/conf cp zoo_sample.

使用Docker在本地搭建Hadoop分布式集群

学习Hadoop集群环境搭建是Hadoop入门必经之路.搭建分布式集群通常有两个办法: 要么找多台机器来部署(常常找不到机器) 或者在本地开多个虚拟机(开销很大,对宿主机器性能要求高,光是安装多个虚拟机系统就得搞半天……). 那么,问题来了! 有没有更有可行性的办法? 提到虚拟化,Docker最近很是火热!不妨拿来在本地做虚拟化,搭建Hadoop的伪分布式集群环境.虽然有点大材小用,但是学习学习,练练手也是极好的. 文章比较长,建议先倒杯水,听我慢慢到来…… 先说一下我的思路吧: 先使用Dock

搭建Spark分布式集群

搭建Spark分布式集群 0.准备先准备好以下软件: 软件版本 ubuntu 14.04 64bit java jdk1.8.0_25 64bit hadoop 2.4.1 64bit scala 2.10.4 spark 1.1.0 maven 3.2.3 1.设置静态IP Ubuntu系统设置静态IP l 设置静态IP Sudogedit /etc/network/interfaces 修改文件: autolo ifaceio inet loop back autoeth0 ifacee