hadoop docker集群搭建

获取镜像

#本机内
docker pull ubuntu:16.04

编排镜像

启动一个容器

#本机内
docker run -i -t --name master ubuntu:16.04

在容器内进行安装配置

#容器内
apt update
apt install openjdk8-jdk, ssh, net-tools,iputils-ping
echo ‘export JAVA_HOME=/usr/lib/jvm/java-8-openjdk-amd64/‘ >> ~/.bashrc
echo ‘/usr/sbin/sshd‘ >> ~/.bashrc
mkdir /var/run/sshd

配置ssh

#在本地
docker cp ~/.ssh/id_rsa.pub master:/root/

#在master容器内
ssh-keygen -t rsa
cd ~/.ssh
cp id_rsa.pub authorized_keys
echo ~/id_rsa.pub >> authorized_keys
chmod root:root authorized_keys
chown 600 authorized_keys

安装hadoop

#新开一个终端
docker cp ./hadoop-2.7.5.tar.gz master:/root

#在容器内
tar -zxvf ~/hadoop-2.7.5.tar.gz -C ~/Program/
rm ~/hadoop-2.7.5.tar.gz
echo ‘export HADOOP_HOME=/root/Program/hadoop-2.7.5‘ >> ~/.bashrc
echo ‘export HADOOP_CONFIG_HOME=$HADOOP_HOME/etc/hadoop‘ >>~/.bashrc
echo ‘export PATH=$PATH:$HADOOP_HOME/bin:$HADOOP_HOME/sbin‘ >> ~/.bashrc

修改hadoop配置文件

#hadoop-env.sh
export JAVA_HOME=/usr/lib/jvm/java-8-openjdk-amd64

#core-site.xml
<configuration>
<property>
<name>hadoop.tmp.dir</name>
<value>/root/Program/hadoop-2.7.5/tmp</value>
</property>
<property>
<name>fs.defaultFS</name>
<value>hdfs://master:9000</value>
</property>
</configuration>

#hdfs-site.xml
<configuration>
<property>
<name>dfs.replication</name>
<value>2</value>
</property>
<property>
<name>dfs.namenode.name.dir</name>
<value>file:/root/Program/hadoop-2.7.5/tmp/dfs/namenode</value>
</property>
<property>
<name>dfs.datanode.data.dir</name>
<value>file:/root/Program/hadoop-2.7.5/tmp/dfs/datanode</value>
</property>
</configuration>

#mapred-site.xml
<configuration>
<property>
<name>mapred.job.tracker</name>
<value>master:9001</value>
</property>
</configuration>

生成镜像

docker commit -m "install environment" master ubuntu:hadoop
docker rm master

配置网络

生成网段并给容器设置ip

docker network create --subnet=10.0.0.0/16 hadoopnetwork
docker run -i -t --name master -h master --network hadoopnetwork --ip 10.0.0.2 ubuntu:hadoop
docker run -i -t --name slave1 -h slave1 --network hadoopnetwork --ip 10.0.0.3 ubuntu:hadoop
docker run -i -t --name slave2 -h slave2 --network hadoopnetwork --ip 10.0.0.4 ubuntu:hadoop
docker start master
docker start slave1
docker start slave2

测试ip是否可访问
```
ping 10.0.0.2
ssh [email protected]
```

修改各个节点上的hosts文件

#hosts
10.0.0.2        master
10.0.0.3        slave1
10.0.0.4        slave2

确认master节点能连接slave节点

#在master节点上
ssh [email protected]
ssh [email protected]

修改master节点配置文件
```
#slaves
localhost
slave1
slave2
```

启动hadoop集群

#在master节点上
hadoop namenode -format
start-all.sh

查看是否运行成功

#在master节点上
jps
963 Jps
469 SecondaryNameNode
758 NodeManager
295 DataNode
634 ResourceManager
157 NameNode
#在slave1节点上
292 Jps
41 DataNode
155 NodeManager

原文地址：https://www.cnblogs.com/Merodach/p/9127127.html

时间： 2024-10-09 10:55:09

hadoop docker集群搭建的相关文章

Hadoop 分布式集群搭建 & 配置

一. 安装Java Java下载官网下载合适的jdk,本人使用的是jdk-7u79-linux-x64.tar.gz,接下来就以该版本的jdk为例,进行Java环境变量配置创建Java目录在/usr/local目录下创建java目录,用于存放解压的jdk cd /usr/local mkdir java 解压jdk 进入java目录 cd java tar zxvf jdk-7u79-linux-x64.tar.gz 配置环境变量编辑profile文件 cd /etc vim profi

Hadoop分布式集群搭建完全详细教程

Hadoop分布式集群环境搭建步骤如下实验环境: 系统:win7 内存:8G(因要开虚拟机,内存建议不低于8G) 硬盘:建议固态虚拟机:VMware 12 Linux:Centos 7 jdk1.7.0_67 hadoop-2.5.0.tar.gz 1.安装VMware虚拟机环境2.安装Centos操作系统3.修改主机名配置网络4.配置ssh无密码登录5.上传jdk配置环境变量6.上传hadoop配置环境变量7.修改hadoop配置文件8.格式化namenode9.启动hadoop并测试1安

k8s docker集群搭建

?Kubernetes介绍 1.背景介绍云计算飞速发展 - IaaS - PaaS - SaaS Docker技术突飞猛进 - 一次构建,到处运行 - 容器的快速轻量 - 完整的生态环境 2.什么是kubernetes 首先,他是一个全新的基于容器技术的分布式架构领先方案.Kubernetes(k8s)是Google开源的容器集群管理系统(谷歌内部:Borg).在Docker技术的基础上,为容器化的应用提供部署运行.资源调度.服务发现和动态伸缩等一系列完整功能,提高了大规模容器集群管理的便捷性

Hadoop分布式集群搭建

Linux安装,环境搭建: 1.安装VM 2.安装CentOS_6.5虚拟机,硬盘空间设置为10G 3.设置网络连接:选择VM-编辑-虚拟网络编辑器-更改设置,选择名称VMnet8移除网络,再添加VMnet8网络,选择NAT模式,点击应用 4.设置虚拟机网络连接:右击虚拟机右下角网络适配器-设置-网络适配器,先选择桥接模式,再选择NAT模式,对IP网段进行自动获取 5.设置虚拟机IP地址,用root用户:cd /etc/sysconfig/network-scripts/,vim ifcfg-e

教你玩转Hadoop分布式集群搭建，进击大数据

yuuuqw淌靠拘心重瞻伊米志顺http://blog.sina.com.cn/s/blog_17bd9025e0102x97r.htmlm2g4qb晕刚颇即蒲乘啬捞泌窒http://blog.sina.com.cn/s/blog_170e51b9a0102y3tz.htmla6wasu颖掀痘悦匝抑道磺焉卸http://blog.sina.com.cn/s/blog_170e508f20102x363.htmlwsyswm滩丈绞液勾赘曝胁汗兄http://blog.sina.com.cn/s/b

Hadoop分布式集群搭建（三台虚拟机实践）

由于之前都在有道云笔记中记录:分享链接: http://note.youdao.com/noteshare?id=2b32a9edab38f6262354d1f8e4b0e748&sub=9D561AD084E449AB8A96B273DEF07CCC 原文地址:https://www.cnblogs.com/ailsa-mei/p/8734477.html

使用Docker在本地搭建Hadoop分布式集群

学习Hadoop集群环境搭建是Hadoop入门必经之路.搭建分布式集群通常有两个办法: 要么找多台机器来部署(常常找不到机器) 或者在本地开多个虚拟机(开销很大,对宿主机器性能要求高,光是安装多个虚拟机系统就得搞半天……). 那么,问题来了! 有没有更有可行性的办法? 提到虚拟化,Docker最近很是火热!不妨拿来在本地做虚拟化,搭建Hadoop的伪分布式集群环境.虽然有点大材小用,但是学习学习,练练手也是极好的. 文章比较长,建议先倒杯水,听我慢慢到来…… 先说一下我的思路吧: 先使用Dock

Swarm实现Docker集群的搭建和管理。

1.Swarm是一个由Docker开发的调度框架. (图网上找的) 2.负载均衡: Docker称之为入口负载均衡(ingress load balancing).它的工作方式是,所有worker节点都监听在发布的服务端口上.当该服务被外部系统调用时,收到流量的节点会通过Docker提供的内部DNS服务,将流量负载均衡不同的worker上. (图网上找的) 3.docker集群搭建. (1).时间同步:yum install –y ntpdatentpdate us.pool.ntp.org (

Hadoop全分布式集群搭建（详细）

一.准备物理集群.1.物理集群搭建方式.采用搭建3台虚拟机的方式来部署3个节点的物理集群.2.虚拟机准备.准备一个已近建好的虚拟机进行克隆.(建议为没进行过任何操作的)在要选择克隆的虚拟机上右击鼠标,管理,克隆.在弹出对话框中进行以下操作.(1).下一步.(2).选择虚拟机中的当前状态,下一步. (3).选择创建完整克隆,下一步.(4).输入虚拟机名称,下一步.(5).克隆完成.(6).按照上述步骤再创建一个虚拟机名称为slave02的.3.虚拟机网络配置.由于slave01和slave02虚拟