[转]搭建Hadoop伪分布式环境

https://my.oschina.net/MyHeaven1987/blog/1821509

http://hadoop.apache.org/docs/current/hadoop-project-dist/hadoop-common/SingleCluster.html#Pseudo-Distributed_Operation

hadoop下载

Hadoop官方下载地址： Hadoop下载地址，目前最新的稳定版本为2.9.1。

hadoop配置

java安装路径指定，在hadoop解压路径下，修改etc/hadoop/hadoop-env.sh脚本指定JAVA安装主路径
```
export JAVA_HOME=/usr/lib/jvm/java-8-openjdk-amd64
```

hdfs配置

etc/hadoop/core-site.xml:

<configuration>
    <property>
        <name>fs.defaultFS</name>
        <value>hdfs://localhost:9000</value>
    </property>
</configuration>

etc/hadoop/hdfs-site.xml

<configuration>
    <property>
        <name>dfs.replication</name>
        <value>1</value>
    </property>
</configuration>

启动ssh免密码登录
通过ssh localhost命令确认是否可以启动免密码登录，如果不行需要运行下面的命令来启动ssh免密码登录
```
ssh-keygen -t rsa -P ‘‘ -f ~/.ssh/id_rsa
cat ~/.ssh/id_rsa.pub >> ~/.ssh/authorized_keys
chmod 0600 ~/.ssh/authorized_keys
```

hadoop伪分布式运行

本地运行MapReduce任务指导

通过hadoop脚本格式化hdfs文件系统
```
bin/hdfs namenode -format
```
启动NameNode守护进程和DataNode守护进程
```
sbin/start-dfs.sh
```
从运行结果图来看这个脚本启动了NameNode，备NameNode和DataNode。
访问NameNode的web管理界面，默认访问地址http://localhost:50070，确认NameNode状态正常
创建hdfs路径用于运行MapReduce任务，<username>需要替换为当前用户名，mkdir创建目录需要逐级创建。
```
bin/hdfs dfs -mkdir /user
bin/hdfs dfs -mkdir /user/<username>
```
拷贝本地文件到分布式文件系统中
```
bin/hdfs dfs -put etc/hadoop input
```

运行hadoop官方提供的示例程序

bin/hadoop jar share/hadoop/mapreduce/hadoop-mapreduce-examples-2.9.1.jar grep input output ‘dfs[a-z.]+‘

获取分布式文件运行的输出文件到本地
```
bin/hdfs dfs -get output output
cat output/*
```

总结

通过伪分布式启动Hadoop，可以看到hadoop运行需要HDFS和mapreduce两部分组成，在后面的博客中我们将会详细了解这两部分。

原文地址：https://www.cnblogs.com/wincai/p/9305796.html

时间： 2024-11-06 07:43:35

[转]搭建Hadoop伪分布式环境的相关文章

Hadoop初体验：快速搭建Hadoop伪分布式环境

0.前言本文旨在使用一个全新安装好的Linux系统从0开始进行Hadoop伪分布式环境的搭建,以达到快速搭建的目的,从而体验Hadoop的魅力所在,为后面的继续学习提供基础环境. 对使用的系统环境作如下说明: 操作系统:CentOS 6.5 64位主机IP地址:10.0.0.131/24 主机名:leaf 用户名:root hadoop版本:2.6.5 jdk版本:1.7 可以看到,这里直接使用root用户,而不是按照大多数的教程创建一个hadoop用户来进行操作,就是为了达到快速搭建Had

阿里云服务器centos7.3下搭建hadoop伪分布式环境

一.软硬件环境 CentOS 7.2 64位 OpenJDK-1.8.0 Hadoop-2.7 二.安装SSH客户端安装ssh: yum install openssh-clients openssh-server 安装完成后,使用以下命令测试: ssh localhost输入 root 账户的密码,如果可以正常登录,则说明SSH安装没有问题. 配置SSH免key登陆 hadoop是一个分布式系统,节点间通过ssh通信,为了避免在连接过程中人工输入密码,需要进行ssh免key登陆的配置,由于本

搭建hadoop伪分布式环境

伪分布式就是只有一台机器,既是namenode又是datanode.一台阿里云服务器(centos)即可完成. Java环境首先需要安装Java环境,下载jdk的安装包,解压到/usr/java/,然后配置环境变量. vim /etc/profile #set java environment export JAVA_HOME=/usr/java/jdk1.8.0_151 export PATH=$JAVA_HOEM/bin:$PATH export CLASSPATH=.:$JAVA_HOM

ubuntu从头开始搭建hadoop伪分布式环境

13年学习过一段时间的hadoop,但是工作中用到的地方比较少,有些生疏,加上现在hadoop版本也已经比较新了,所以空闲时间想继续学习一下,找到这篇文章,从头开始搭建一个hadoop环境,转过来备忘 Hadoop developers usually test their scripts and code on a pseudo-distributed environment(also known as a single node setup), which is a virtual mach

构建Hadoop伪分布式环境

构建Hadoop伪分布式环境这篇文章介绍Hadoop伪分布式环境的搭建过程与原理,是个人的学习总结,以纪念在各个步骤中遇到的麻烦.踩过的坑! 这篇笔记包含这样几个内容: 配置伪分布式环境运行一个简单的作业可能遇到的问题及解决办法配置伪分布式环境本文中的内容基于Hadoop2,即MapReduce作业运行在Yarn平台之上. 打通SSH,实现无密码登陆由于Hadoop控制脚本需要登陆到集群中的Slave节点执行操作(比如,启动守护进程),如果每一次登录都输入密码,显然不是个好办法.集群

Hadoop伪分布式环境配置

Step1:关闭防火墙 service iptables stop[status] service iptables status chkconfig --list |grep iptables chkconfig iptables offStep2:修改IP (重启网卡:service network restart)Step3:修改hostname /etc/hostsStep4:SSH免密码登陆产生密钥(~/.ssh中)ssh-keygen -t rsa cd ~/

一、Hadoop伪分布式环境搭建

Hadoop 2.x伪分布式环境搭建步骤: 1.修改hadoop-env.sh.yarn-env.sh.mapred-env.sh 方法:使用notepad++(beifeng用户)代开这三个文件添加代码:export JAVA_HOME=/opt/modules/jdk1.7.0_67 2.修改core-site.xml.hdfs-site.xml.yarn-site.xml.mapred-site.xml配置文件 1)修改core-site.xml <configuration> <

Hadoop学习笔记之Hadoop伪分布式环境搭建

搭建为伪分布式Hadoop环境 1.宿主机(Windows)与客户机(安装在虚拟机中的Linux)网络连接. a) Host-only 宿主机与客户机单独组网: 好处:网络隔离: 坏处:虚拟机和其他服务器之间不能通讯: b) Bridge 桥接宿主机与客户机在同一个局域网中. 好处:窦在同一个局域网,可以互相访问: 坏处:不完全. 2.Hadoop的为分布式安装步骤 a) 设置静态IP 在centos下左面上右上角图标右键修改: 重启网卡service network restart; 验证:

《OD大数据实战》hadoop伪分布式环境搭建

一.安装并配置Linux 8. 使用当前root用户创建文件夹,并给/opt/下的所有文件夹及文件赋予775权限,修改用户组为当前用户 mkdir -p /opt/modules mkdir -p /opt/software mkdir -p /opt/datas mkdir -p /opt/tools chmod 775 /opt/* chown beifeng:beifeng /opt/* 最终效果如下: [[email protected]02 opt]$ pwd /opt [[email