Hadoop伪分布模式操作

http://blog.csdn.net/wangloveall/article/details/20195813

摘要:本文介绍Hadoop伪分布模式操作,适合于Hadoop学习、开发和调试。

关键词:Hadoop    伪分布式   文件配置

启动Hadoop支持三种模式操作,分别是单机模式操作、伪分布模式操作和全分布模式操作。

单机模式操作是Hadoop的默认操作模式,当首次解压Hadoop的源码包时,Hadoop无法了解硬件安装环境,会保守地选择最小配置,即单机模式。该模式主要用于开发调试MapReduce程序的应用逻辑,而不会和守护进程交互,避免增加额外的复杂性。

伪分布模式操作是指在“单节点集群”上运行Hadoop,其中所有的守护进程都运行在同一台机器上。该模式在单机模式操作之上多了代码调试功能,可以查阅内存的使用情况、HDFS的输入输出以及守护进程之间的交互。

全分布模式操作是指一种实际意义上的Hadoop集群,其规模可从几个节点的小集群到成百上千个节点的大集群,甚至是成千上万的超大集群。

单机模式操作和伪分布模式操作均用于开发与调试的目的。真实的Hadoop 集群是全分布模式操作。

伪分布模式操作Hadoop集群,具体步骤如下。

第一步:前期工作

1 设置静态IP,完毕后,重启网卡,执行命令:service network restart。验证是否成功,执行命令:ifconfig。

2 查阅并修改主机名。

1)查阅当前会话的主机名,执行命令:hostname。

2)修改当前会话的主机名,执行命令:hostname   hadoop。

该修改只能在本次操作生效。

3)通过配置文件修改主机名,执行命令:vi  /etc/sysconfig/network

该修改长期有效。

验证:重启机器

3  把主机名和ip进行绑定,执行命令: vi   /etc/hosts

增加一行内容  ip   主机名

保存退出

验证: ping  主机名

4  关闭防火墙

执行命令  service  iptables stop

验证:service iptables status

6  关闭防火墙的自动运行

执行命令  chkconfig   iptables  off

验证:chkconfig  - - list  | grep  iptables

第二步:SSH 免密码登录

对Linux进行操作 通过Shell。

a)执行命令  ssh-keygen   -t  rsa  产生密钥,位于~/.ssh文件夹中

b)执行命令 cp  ~/.ssh/id_rsa.pub   ~/.ssh/authorized_keys

验证:ssh  localhost

第三步:安装JDK软件

a)执行命令rm  -rf  /usr/local/*  删除所有内容

b)使用小工具Winscp把jdk文件从Windows环境下复制到Linux下的/usr/local目录下

c)执行命令  chmod   u+x  jdk-6u24-linux-i586.bin 授予执行权限

d)执行命令  ./jdk-6u24-linux-i586.bin  解压缩到当前目录下

e)执行命令 mv jdk1.6.0_24   jdk

f)执行命令 vi /etc/profile  设置环境变量,增加了两行内容

export   JAVA_HOME=/usr/local/jdk

export   PATH=.:$JAVA_HOME/bin:$PATH

保存退出

执行命令 source    /etc/profile   让该设置立即生效。

验证:java –version

第四步:伪分布模式操作Hadoop

1 执行命令  tar  -zxvf  hadoop-1.1.2.tar.gz进行解压缩

2 执行命令  mv  hadoop-1.1.2  hadoop  重命名hadoop

3 执行命令 vi /etc/profile  设置环境变量,增加了一行内容

export   HADOOP_HOME=/usr/local/hadoop

修改了一行内容

export   PATH=.:$HADOOP_HOME/bin:$JAVA_HOME/bin:$PATH

保存退出,执行命令:wq

执行命令 source    /etc/profile   让该设置立即生效。

4
 修改hadoop配置文件,位于$HADOOP_HOME/conf目录下的4个文件,分别是hadoop-env.sh、core-site.xml、hdfs-site.xml、mapred-site.xml

a)配置hadoop-env.sh文件,把JAVA_HOME设置为Java安装根路径。

b)配置core-site.xml文件

<?xml version="1.0"?>
<?xml-stylesheet type="text/xsl"
href="configuration.xsl"?>

<!-- Put site-specific property overrides in this file. -->

<configuration>
<property>
<name>fs.default.name</name>
<value>hdfs://hadoop:9000</value>
<description>change
your own
hostname</description>
</property>
<property>
<name>hadoop.tmp.dir</name>
<value>/usr/local/hadoop/tmp</value>
</property>

</configuration>

c)配置hdfs-site.xml文件

<?xml version="1.0"?>
<?xml-stylesheet type="text/xsl"
href="configuration.xsl"?>

<!-- Put site-specific property overrides in this file. -->

<configuration>
<property>
<name>dfs.replication</name>
<value>1</value>
</property>
<property>
<name>dfs.permissions</name>
<value>false</value>
</property>

</configuration>

d)配置mapred-site.xml文件

<?xml version="1.0"?>
<?xml-stylesheet type="text/xsl"
href="configuration.xsl"?>

<!-- Put site-specific property overrides in this file. -->

<configuration>
<property>
<name>mapred.job.tracker</name>
<value>hadoop:9001</value>
<description>change
your own
hostname</description>
</property>

</configuration>

d)执行命令hadoop  namenode  -format   对hadoop进行格式化

f)执行命令 start-all.sh启动

验证:

(1)执行命令jps会有5个进程,分别是NameNode、

DataNode、SecondaryNameNode、JobTracker,

TaskTracker。

(2)通过Linux下的浏览器查看,输入网址

http://hadoop:50070

http:// hadoop:50030

(3)通过Windows下的浏览器查看,可以修改windows的hosts文件

Source:

http://www.wangluqing.com/2014/02/hadoop-weifenbu-operation/

http://hadoop.apache.org/docs/r1.2.1/single_node_setup.html

http://hadoop.apache.org/docs/r1.0.4/cn/quickstart.html

Hadoop伪分布模式操作,布布扣,bubuko.com

时间: 2024-10-26 22:07:12

Hadoop伪分布模式操作的相关文章

Hadoop全分布模式操作

http://blog.csdn.net/wangloveall/article/details/20767161 摘要:介绍Hadoop全分布模式操作,实现真正意义上的集群架构. 关键词:Hadoop  全分布模式  文件配置 利用Hadoop解决大数据问题时,我们是用全分布模式来操作Hadoop. 如何基于全分布模式来操作Hadoop,构建Hadoop集群呢?具体步骤如下. 第一步:配置hosts文件. 执行命令: vi  /etc/hosts,修改所有的节点,使得彼此之间都能把主机名解析为

Hadoop伪分布模式的安装

Hadoop伪分布模式的安装 [环境参数] (1)Host OS:Win7 64bit (2)IDE:Eclipse Version: Luna Service Release 2 (4.4.2) (3)虚拟机:VMware 10 (4)Client OS:CentOS 6.4 32bit. 注意: 若是CentOS 64bit,则在启动hadoop时,会报出警告. 原因:Hadoop的本地库($HADOOP_HOME/lib/native/libhadoop.so.1.0.0)是在32 bit

Spark教程-构建Spark集群-配置Hadoop伪分布模式并运行Wordcount示例(1)

第四步:配置Hadoop伪分布模式并运行Wordcount示例 伪分布模式主要涉及一下的配置信息: 修改Hadoop的核心配置文件core-site.xml,主要是配置HDFS的地址和端口号: 修改Hadoop中HDFS的配置文件hdfs-site.xml,主要是配置replication; 修改Hadoop的MapReduce的配置文件mapred-site.xml,主要是配置JobTracker的地址和端口: 在具体操作前我们先在Hadoop目录下创建几个文件夹: 下面开始构建具体的伪分布式

3-2 Hadoop伪分布模式配置部署

Hadoop伪分布模式配置部署 一.实验介绍 1.1 实验内容 hadoop配置文件介绍及修改 hdfs格式化 启动hadoop进程,验证安装 1.2 实验知识点 hadoop核心配置文件 文件系统的格式化 测试WordCount程序 1.3 实验环境 hadoop2.7.6 CentOS6终端 1.4 适合人群 本课程难度为一般,属于初级级别课程,适合具有hadoop基础的用户. 1.5 相关文件 https://pan.baidu.com/s/1a_Pjl8uJ2d_-r1hbN05fWA

hadoop伪分布模式搭建(下)

搭建伪分布式是在一台机器上模拟分布式部署,方便学习和调试. 1.解压hadoop文件 下载好的hadoop ,我们可以通过使用WinSCP 把压缩包软件把它 从宿主机复制移动到linux 的/usr/local 目录下. 解压缩文件,并重命名为hadoop,方便使用.重命名后这时,hadoop 目录的完整路径是"/usr/local/hadoop" 设置环境变量HADOOP_HOME,修改文件"/etc/profile" 修改环境变量后,执行source 命令,使配

Hadoop伪分布模式环境搭建

最近开始研究学习hadoop,想把自己的一些知识点写在这里作为自己的学习记录.同时,如果能够为有需要的朋友带来帮助也是一件快乐的事.这篇文章基本上都是参考网上的资料,我按照自己的理解和实践经验将其组织起来.网上大多教程没有具体介绍操作的背后原因,我按照我的理解以及将一些分布于网上比较散乱的细碎知识点进行了组织.因为时间以及个人能力原因,本安装文档会存在很多不足,后期我也会努力去学习提高自己.我的博客园之旅就以此hadoop安装开始.因为时间原因,我第一次发博客,图片没有加上,不过文章基本描述清楚

Hadoop伪分布模式配置部署

二.Hadoop伪分布式模式配置 本实验需要按照上一节单机模式部署后继续进行操作 1. 配置core-site.xml, hdfs-site.xml,mapred-site.xml及yarn-site.xml 1).修改core-site.xml: $ sudo gvim /usr/local/hadoop/etc/core-site.xml <?xml version="1.0"?> <?xml-stylesheet type="text/xsl"

Spark教程-构建Spark集群-配置Hadoop伪分布模式并运行Wordcount(2)

执行文件拷贝操作 拷贝后的“input”文件夹的内容如下所示: 和我们的hadoop安装目录下的“conf”文件的内容是一样的. 现在,在我们刚刚构建的伪分布式模式下运行wordcount程序: 运行完成后我们查看一下输出的结果: 部分统计结果如下: 此时我们到达Hadoop的web控制台会发现我们提交并成功的运行了任务: 最后在Hadoop执行完任务后,可以关闭Hadoop后台服务: 至此,Hadoop伪分布式环境的搭建和测试你完全成功! 至此,我们彻底完成了实验.

Hadoop学习笔记(3)hadoop伪分布模式安装

为了学习这部分的功能,我们这里的linux都是使用root用户登录的.所以每个命令的前面都有一个#符号. 伪分布模式安装步骤: 关闭防火墙 修改ip地址 修改hostname 设置ssh自动登录 安装JDK 安装hadoop 1. 关闭防火墙 具体的操作过程参见博文:我用过的Linux命令--关闭防火墙 2. 修改ip地址 具体的操作过程参见博文: 3. 修改hostname 具体的操作过程参见博文:我用过的Linux命令--修改主机名