centos7搭建伪分布式集群

centos7搭建伪分布式集群

需要

  centos7虚拟机一台;

  jdk-linux安装包一个

  hadoop-2.x安装包1个(推荐2.7.x)

一、设置虚拟机网络为静态IP(最好设成静态,为之后编程提供方便,不设置静态ip也可以)

1、进入网络配置查看ip

2、选择NAT模式链连接

3、点击NAT设置,记住网关IP,后面要用到

4、进入终端,输入命令: cd  /etc/sysconfig/network-scripts,然后 vim ./ifcfg-eth0,(有的虚拟机是文件是:ifcfg-ens33)并进行如下设置,

【IPADDR为静态ip地址,格式必须与网关IP的前三位一样:192.168.13.X】 X在1-255之间

GATWAY是之前记得的网关IP.

其他的如图所示。

5、重启网络服务:service network restart

6、网络测试:ping网关,ping外网。都能ping通表示网络正常,大功告成(前提主机联网)

成功标志如图:

二、配置ssh免密登录(开启集群服务时不必每次都输入密码)

  1、命令:ssh-keygen    一路回车。遇到overwrite(覆盖写入)输入y

  

  2、将生成的密钥发送到本机地址:ssh-copy-id localhost

  

  3、测试是否可以免密登录。出现下图解果就OK;

  

三、安装java环境(jdk)

1、卸载虚拟机自带的dk; 

  确定JDK版本

  rpm –qa | grep jdk

  rpm –qa | grep gcj

  

  切换到root用户,根据结果卸载java

  yum -y remove java-1.8.0-openjdk-headless.x86_64

  yum -y remove java-1.7.0-openjdk-headless.x86_64

2、测试jdk是否卸载干净 java -version

  

3、安装jdk.

  将jdk-linux-xxx解压到某一个文件夹(记好路径,不要有中文)

  

  通过pwd命令查看当前路径

  

   

  

4、配置环境变量

  在root用户下,将/etc/profile的权限赋给普通用户:chown -R zck:zck /etc/profile  (zck是我的普通用户名,不然普通用户无法修改环境变量)

  

  

  转到普通用户(zck)下,修改环境变量:vim /etc/profile    (注意自己的jdk路径)

  

  


#java

export  JAVA_HOME=/home/hadoop/app/jdk1.8.0_141

export JAVA_JRE=JAVA_HOME/jre

export CLASSPATH=.:$JAVA_HOME/lib:$JAVA_JRE/lib

export PATH=$PATH:$JAVA_HOME/bin

5、保存退出,并使/etc/profile文件生效:source  /etc/profile

6、测试jdk环境:java -version

四、安装hadoop

  1、解压hadoop(同jdk)

  2、配置环境变量(基本步骤与jdk一样)。


#hadoop
export HADOOP_HOME=/home/zck/software/hadoop
export PATH=$PATH:$HADOOP_HOME/bin:$HADOOP_HOME/sbin

3、测试(保存之后要source /etc/profile   不然环境变量修改不生效)

五、搭建伪分布式

修改6个配置文件

进入文件目录 ../hadoop/etc/hadoop

1、修改core-site.xml配置文件 (建议将localhost修改为你之前设置的静态ip)


<configuration>

<property>

<name>fs.defaultFS</name>

<value>hdfs://localhost:9000</value>

</property>

<property>

<name>hadoop.tmp.dir</name>

<value>file:/data/tmp</value>

</property>

<property>

<name>hadoop.proxyuser.hadoop.hosts</name>

<value>*</value>

</property>

<property>

<name>hadoop.proxyuser.hadoop.groups</name>

<value>*</value>

</property>

</configuration>

2、修改hdfs-site.xml配置文件


<configuration>

<property>

<name>dfs.namenode.name.dir</name>

<value>/data/dfs/name</value>

<final>true</final>

</property>

<property>

<name>dfs.datanode.data.dir</name>

<value>/data/dfs/data</value>

<final>true</final>

</property>

<property>

<name>dfs.replication</name>

<value>1</value>

</property>

<property>

<name>dfs.permissions</name>

<value>false</value>

</property>

</configuration>

3、修改hadoop-env.sh配置文件(改成jdk位置)

4、修改mapred-site.xml.template配置文件(先重命名为mapred-site.xml)


<configuration>

<property>

<name>mapreduce.frameword.name</name>

<value>yarn</value>

</property>

</configuration>

5、修改yarn-site.xml配置文件


<property>

<name>yarn.nodemanager.aux-servies</name>

<value>mapreduce_shuffle</value>

</property>

</configuration>

使修改生效,命令:sourec /etc/profile

6、格式化namenode

切回到hadoop目录,输入如下命令:bin/hdfs  namenode -format

启动hadoop伪分布式集群:sbin/start-all.sh

启动完毕输入jps查看

原文地址:https://www.cnblogs.com/2016-zck/p/11449333.html

时间: 2024-10-23 01:46:49

centos7搭建伪分布式集群的相关文章

hadoop-2.9.2搭建伪分布式集群

准备4台机器分别为node1   node2    node3    node5 1.第一台node1 1.修改固定IP 2.修改主机名 3.添加与其他机器的映射 2.第二台机器 通过克隆复制多个,按上面的配置进行配置 3.免密登录 假如node1需要免密登录到node2   node3   node5 在node1的机器上执行 ssh-keygen -t rsa 生成的秘钥文件在root/.ssh目录下 在node1上把生成的公钥给其他node2  node3  node5 在其他机器上执行

Hadoop伪分布式集群搭建-此文章在个人51.cto转载

一.HDFS伪分布式环境搭建 Hadoop分布式文件系统(HDFS)被设计成适合运行在通用硬件(commodity hardware)上的分布式文件系统.它和现有的分布式文件系统有很多共同点.但同时,它和其他的分布式文件系统的区别也是很明显的.HDFS是一个高度容错性的系统,适合部署在廉价的机器上.HDFS能提供高吞吐量的数据访问,非常适合大规模数据集上的应用.HDFS放宽了一部分POSIX约束,来实现流式读取文件系统数据的目的.HDFS在最开始是作为Apache Nutch搜索引擎项目的基础架

hadoop伪分布式集群搭建与安装(ubuntu系统)

1:Vmware虚拟软件里面安装好Ubuntu操作系统之后使用ifconfig命令查看一下ip; 2:使用Xsheel软件远程链接自己的虚拟机,方便操作.输入自己ubuntu操作系统的账号密码之后就链接成功了: 3:修改主机的名称vi /etc/hostname和域名和主机映射对应的关系 vi /etc/hosts,改过之后即生效,自己可以ping一下,我这里ip对应master,比如ping master之后发现可以ping通即可: 4:修改过主机名称和主机名与ip对应的关系之后:开始上传jd

ZooKeeper的伪分布式集群搭建以及真分布式集群搭建

zk集群的一些基本概念 zookeeper集群搭建: zk集群,主从节点,心跳机制(选举模式) 配置数据文件 myid 1/2/3 对应 server.1/2/3 通过 zkCli.sh -server [ip]:[port] 命令检测集群是否配置成功 和其他大多数集群结构一样,zookeeper集群也是主从结构.搭建集群时,机器数量最低也是三台,因为小于三台就无法进行选举.选举就是当集群中的master节点挂掉之后,剩余的两台机器会进行选举,在这两台机器中选举出一台来做master节点.而当原

ZooKeeper的伪分布式集群搭建

ZooKeeper集群的一些基本概念 zookeeper集群搭建: zk集群,主从节点,心跳机制(选举模式) 配置数据文件 myid 1/2/3 对应 server.1/2/3 通过 zkCli.sh -server [ip]:[port] 命令检测集群是否配置成功 和其他大多数集群结构一样,zookeeper集群也是主从结构.搭建集群时,机器数量最低也是三台,因为小于三台就无法进行选举.选举就是当集群中的master节点挂掉之后,剩余的两台机器会进行选举,在这两台机器中选举出一台来做maste

Hadoop伪分布式集群搭建总结

Hadoop伪分布式集群搭建总结 一.所需软件VMware15!CentOS6.5JDK1.8Hadoop2.7.3二.安装注意:对文件进行编辑:输入a,表示对该文件进行编辑,最后保存该文件,操作为:点击键盘上的Esc按钮,然后输入英文的:字符,再输入wq,点击回车,完成文件的保存.1.关闭防火墙和禁用SELINUX(1).永久关闭防火墙,重启Linux系统(2) .禁用SELINUX:修改文件参数 重启Linux使其生效(3).检查防火墙是否运行,显示下图即为关闭2.配置hostname与IP

ZooKeeper伪分布式集群安装

获取ZooKeeper安装包 下载地址:http://apache.dataguru.cn/zookeeper 选择一个稳定版本进行下载,我这里下载的是zookeeper-3.4.6版本. ZooKeeper伪分布式集群安装 伪分布式集群:在一台Server中,启动多个ZooKeeper的实例. 上传并解压安装包 cd /usr rz -by tar xf zookeeper-3.4.6.tar.gz 创建实例配置文件 cd zookeeper-3.4.6/conf cp zoo_sample.

使用Docker在本地搭建Hadoop分布式集群

学习Hadoop集群环境搭建是Hadoop入门必经之路.搭建分布式集群通常有两个办法: 要么找多台机器来部署(常常找不到机器) 或者在本地开多个虚拟机(开销很大,对宿主机器性能要求高,光是安装多个虚拟机系统就得搞半天……). 那么,问题来了! 有没有更有可行性的办法? 提到虚拟化,Docker最近很是火热!不妨拿来在本地做虚拟化,搭建Hadoop的伪分布式集群环境.虽然有点大材小用,但是学习学习,练练手也是极好的. 文章比较长,建议先倒杯水,听我慢慢到来…… 先说一下我的思路吧: 先使用Dock

搭建Spark分布式集群

搭建Spark分布式集群 0.准备 先准备好以下软件: 软件 版本 ubuntu 14.04 64bit java jdk1.8.0_25 64bit hadoop 2.4.1 64bit scala 2.10.4 spark 1.1.0 maven 3.2.3 1.设置静态IP Ubuntu系统设置静态IP l 设置静态IP Sudogedit /etc/network/interfaces 修改文件: autolo ifaceio inet loop back autoeth0 ifacee