搭建Hadoop的伪分布环境

搭建伪分布环境

  • 上传hadoop2.7.0编译后的包并解压到/zzy目录下

mkdir /zzy

解压

tar -zxvf hadoop.2.7.0.tar.gz -C /zzy

?

?

  • 配置hadoop

注意:hadoop2.x的配置文件$HADOOP_HOME/etc/hadoop

????伪分布式需要修改5个配置文件

第一个:hadoop-env.sh

????????vim hadoop-env.sh

????????#第27行

????????export JAVA_HOME=/usr/java/jdk1.7.0_79

????????

第二个:core-site.xml

????????<!--指定fs的默认名称-->

????????<property>

<name>fs.default.name</name>

<value>hdfs://zzy:9000</value>

</property>

????????<!-- 指定HDFS的老大(NameNode)的地址 -->

????????<property>

????????????<name>fs.defaultFS</name>

????????????<value>hdfs://zzy:9000</value>

????????</property>

????????<!-- 指定hadoop运行时产生文件的存储目录 -->

????????<property>

????????????<name>hadoop.tmp.dir</name>

????????????<value>/zzy/hadoop-2.7.0/tmp</value>

</property>

????????

第三个:hdfs-site.xml

????????<!-- 指定HDFS副本的数量 -->

????????<property>

????????????<name>dfs.replication</name>

????????????<value>1</value>

</property>

????????

第四个:mapred-site.xml (mv mapred-site.xml.template mapred-site.xml)

????????mv mapred-site.xml.template mapred-site.xml

????????vim mapred-site.xml

????????<!-- 指定mr运行在yarn上 -->

????????<property>

????????????<name>mapreduce.framework.name</name>

????????????<value>yarn</value>

</property>

????????

第五个:yarn-site.xml

????????<!-- 指定YARN的老大(ResourceManager)的地址 -->

????????<property>

????????????<name>yarn.resourcemanager.hostname</name>

????????????<value>zzy</value>

????????</property>

????????<!-- reducer获取数据的方式 -->

????????<property>

????????????<name>yarn.nodemanager.aux-services</name>

????????????<value>mapreduce_shuffle</value>

????</property>

  • 将hadoop添加到环境变量

vim /etc/profile

内容如下:

JAVA_HOME=/usr/java/jdk1.7.0_79

HADOOP_HOME=/zzy/hadoop-2.4.1

export PATH=$PATH:$JAVA_HOME/bin:$HADOOP_HOME/bin:$HADOOP_HOME/sbin

?

让配置生效:

source /etc/profile

?

  • 格式化namenode(是对namenode进行初始化)

hdfs namenode -format 或者 hadoop namenode -format

?

  • 启动hadoop

    ?

    • 先启动HDFS

    sbin/start-dfs.sh

????????

  • 再启动YARN

????sbin/start-yarn.sh

?

  • 验证是否启动成功

使用jps命令验证

27408 NameNode

28218 Jps

27643 SecondaryNameNode

28066 NodeManager

27803 ResourceManager

27512 DataNode

????

http://192.168.0.2:50070 (HDFS管理界面)

http://192.168.0.2:8088 (MR管理界面)

?

Hadoop环境测试

  • 测试HDFS

    • HDFS shell操作

    #查看帮助

????????????hadoop fs -help <cmd>

#上传

????????????hadoop fs -put <linux上文件> <hdfs上的路径>

#查看文件内容

????????????hadoop fs -cat <hdfs上的路径>

#查看文件列表

????????????hadoop fs -ls /

#下载文件

????????????hadoop fs -get <hdfs上的路径> <linux上文件>

?

  • 上传文件到hdfs文件系统上

hadoop fs -put <linux上文件> <hdfs上的路径>

例如:hadoop fs -put /root/install.log hdfs://zzy:9000/

  • 删除hdfs系统文件

hadoop fs -rmr hdfs://zzy:9000/install.log

?

注:如果能正常上传和删除文件说明HDFS没问题。

  • 测试Yarn

    • 上传一个文件到HDFS

    hadoop fs -put words.txt hdfs://zzy:9000/

    ?

    • 让Yarn来统计一下文件信息

    cd /$HADOOP_HOME/etc/hadoop/share/hadoop/target/mapreduce/

    #测试命令

    hadoop jar hadoop-mapreduce-examples-2.7.0.jar wordcount /works.txt hdfs://zzy:9000/wc

    ?

    ?

    注:如果能正常生成一个目录,并把统计信息输出到文件夹下,说明Yarn没问题。

时间: 2024-10-25 11:21:52

搭建Hadoop的伪分布环境的相关文章

一:搭建Hadoop的伪分布环境*

1.上传hadoop2.7.0编译后的包并解压到/hadoop2目录下  mkdir /hadoop2 解压 tar  -zxvf  hadoop.2.7.0.tar.gz -C /hadoop2 2.解压后hadoop2的目录结构 bin Hadoop最基本的管理脚本和使用脚本,这些脚本是sbin目录下管理脚本的基础实现,用户可以用这些脚本管理和使用hadoop etc hadoop配置文件所在的目录,包括core-site.xml.hdfs-site.xml.mapred-site.xml等

Hadoop伪分布环境搭建——Linux环境配置

hadoop最近可以说是相当火,也勾起了我的兴趣,所以打算学习一下.想要学习hadoop肯定要先学会在自己的电脑上搭建一个hadoop伪分布环境.伪分布模式安装步骤的第一步就是要配置Linux环境.我自己的Linux是Ubuntu系统,不过只要是Linux系统,都大同小异,配置步骤基本没啥区别. 首先,需要进行本地网络配置.我们需要在linux系统下新增一个网络连接,自己设定好ip(ipv4)地址,子网掩码和网官.下图是我的设置: 接下来,还需要在window本地连接上也设置windows下的i

Hadoop2.0 伪分布环境的搭建

准备Linux环境[JAVA,IP,hostname,hosts,iptables,chkconfig,ssh] 不会配置的找1.0下面的伪分布环境搭建 下载稳定版2.2.0 修改etc/hadoop目录下的配置文件core-site.xml,hdfs-site.xml,yarn-site.xml,mapred-site.xml 文件core-site.xml <configuration> <property> <name>fs.defaultFS</name&

高效5步走,快速搭建Hadoop2伪分布环境

前两天将Hadoop2的完全分布式搭建文档整理发布于网上(http://blog.csdn.net/aaronhadoop/article/details/24859369),朋友相邀,就再将Hadoop2的伪分布式文档整理一下,搭建过Hadoop2完全分布式后,就笑对"伪分布式"说声 呵呵吧. 前期的jdk环境.SSH免密钥登录配置在此就不再赘述了,直接进入hadoop2的配置.本文Hadoop2配置文件路径:/usr/local/hadoop/etc/hadoop. 开启Hadoo

Hadoop.2.x_伪分布环境搭建

一. 基本环境搭建 1. 设置主机名.静态IP/DNS.主机映射.windows主机映射(方便ssh访问与IP修改)等 设置主机名: vi /etc/sysconfig/network # 重启系统生效(临时修改: hastname xxx;另起一个终端将会看到效果,需要注意的是: 若即将搭建Hadoop,这里起的hostname禁止使用"_") 设置静态IP/DNS: vi /etc/sysconfig/network-scripts/ifcfg-eth0(示例:修改BOOTPROT

大数据学习:Hadoop中伪分布的搭建

<注:我们假设使用的是一个没有进行过任何配置的Linux系统,下面我们开始进行伪分布的搭建> 1.设置IP 地址 设置完成后,执行命令:service iptables restart 验证:         ifconfig 2. 关闭防火墙 执行命令        service iptables stop 验证:                 service iptables status 3.关闭防火墙的自动运行 执行命令        chkconfig iptables off

Hadoop2.6.0伪分布环境搭建

用到的软件: 一.安装jdk: 1.要安装的jdk,我把它拷在了共享文件夹里面.   (用优盘拷也可以) 2.我把jdk拷在了用户文件夹下面. (其他地方也可以,不过路径要相应改变) 3.执行复制安装解压命令: 解压完毕: 查看解压的文件夹: 4.配置 环境变量: 写入如下5行代码: 使配置生效: 5.查看安装的jdk: java -version java javac 二.SSH免密码登陆: 1.安装SSH: 2.是否生成 .ssh 目录: 3.如果没有生成,自己手动创建一个 .ssh 目录:

【Hadoop】伪分布式环境搭建、验证

Hadoop伪分布式环境搭建: 自动部署脚本: #!/bin/bash set -eux export APP_PATH=/opt/applications export APP_NAME=Ares # 安装apt依赖包 apt-get update -y && apt-get install supervisor -y && apt-get install python-dev python-pip libmysqlclient-dev -y # 安装pip.python

hadoop安装 伪分布

伪分布hadoop 安装总结 准备,在配置中hadoop用的9000端口,如果有其它软件用着这个端口,建议更换后再进行下面配置,以避免出现错误.比如php-fpm经常使用9000端口. 一.下载jdk下载linux 64 8u73-64位版本tar zxvf jdk-8u74-linux-x64.tar.gz -C /usr/local/ 二.下载hadooptar zxvf hadoop-2.6.4.tar.gz -C /usr/local/ 配置项: vim /etc/profile.d/h