[Nutch]Hadoop多机完全分布式模式hadoop配置

1. 下载hadoop

使用如下命令:

wget http://mirror.bit.edu.cn/apache/hadoop/common/hadoop-1.2.1/hadoop-1.2.1.tar.gz

使用如下命令解压:

tar -zxvf hadoop-1.2.1.tar.gz

2. 配置hadoop

将hadoop的bin目录加入到配置文件中,使用如下命令:

vim .bashrc

添加如下行:

export PATH=/home/hadoop/workspace/hadoop-1.2.1/bin:$PATH

如下:

使用如下命令使其生效:

source  .bashrc

验证hadoop路径,使用如下命令:

which hadoop

如下:

3. 配置hadoop的运行参数

3.1 修改masters配置文件

将localhost修改为host1:

vim conf/masters

3.2 修改slaves配置文件

删除localhost,添加host1,,host2,host3:

vim conf/slaves

3.3 修改core-site.xml

使用如下命令:

vim conf/core-site.xml

添加如下内容:

<property>
<name>fs.default.name</name>
<value>hdfs://host1:9000</value>
</property>

如下:

3.4 修改hdfs-site.xml

使用如下命令:

vim conf/hdfs-site.xml

添加如下内容:

<property>
  <name>dfs.name.dir</name>
  <value>/home/hadoop/dfs/filesystem/name</value>
</property>
<property>
  <name>dfs.data.dir</name>
  <value>/home/hadoop/dfs/filesystem/data</value>
</property>
<property>
  <name>dfs.replication</name>
  <value>3</value>
</property>

如下:

3.5 修改mapred-site.xml文件

使用如下命令:

vim conf/mapred-site.xml

添加如下内容:

<property>
  <name>mapred.job.tracker</name>
  <value>host1:9001</value>
</property>
<property>
  <name>mapred.tasktracker.map.tasks.maximum</name>
  <value>4</value>
</property>
<property>
  <name>mapred.tasktracker.reduce.tasks.maximum</name>
  <value>4</value>
</property>
<property>
  <name>mapred.system.dir</name>
  <value>/home/hadoop/mapreduce/system</value>
</property>
<property>
  <name>mapred.local.dir</name>
  <value>/home/hadoop/mapreduce/local</value>
</property>

如下:

3.6 修改hadoop-env.sh文件

使用vim打开conf目录下面的hadoop-env.sh文件:

vim conf/hadoop-env.sh

在里面配置JAVA_HOME,加入如下内容:

export JAVA_HOME=/usr/lib/jvm/java-8-oracle

如图:

4. 复制hadoop文件到其他主机结点

使用如下命令复制到主机host2:

scp -r /home/hadoop/workspace/hadoop-1.2.1  hadoop@host2:/home/hadoop/workspace/hadoop-1.2.1

如下:

使用如下命名复制到主机host3:

scp -r /home/hadoop/workspace/hadoop-1.2.1  hadoop@host3:/home/hadoop/workspace/hadoop-1.2.1

如下:

5. 格式化名称节点并启动集群

使用如下命令:

hadoop namenode -format

如下:

6. 启动集群

使用如下命令:

start-all.sh

如下:

7.查看各个主机结点启动的进程

在host1上使用jps可以看到如下进程:

在host2上使用jps可以看到如下进程:

在host3上使用jps可以看到如下进程:

8. 查看web管理页面

时间: 2024-11-03 21:28:43

[Nutch]Hadoop多机完全分布式模式hadoop配置的相关文章

[Nutch]Hadoop多机完全分布式模式主机配置

在上一篇博文中我们有介绍hadoop的单机伪分布式模式的使用,那么现在我们就来看下多机完全分布式模式. 1. 多主机配置 1.1 对多台机器进行主机名设置 用root账户使用如下命令: vim /etc/hostname 分别对三台机器设置为:host1.host2.host3 1.2 配置主机映射 用root账户使用如下命令: vim /etc/hosts 分别配置三台机器: host1: host2: host3: 2. 配置ssh 2.1 产生密钥 使用如下命令: ssh-keygen -

Hadoop系列之hdfs(分布式文件系统)安装配置

Hadoop系列之hdfs(分布式文件系统)安装配置环境介绍:     ip                        节点192.168.3.10      hdfs-master192.168.3.11      hdfs-slave1192.168.3.12      hdfs-slave21.在所有机器添加hosts192.168.3.10      hdfs-master192.168.3.11      hdfs-slave1192.168.3.12      hdfs-slav

Hadoop完全分布式模式的配置与安装

转自: http://www.cyblogs.com/ 我自己的博客~ 首先, 我们需要3台机器, 这里我是在Vmware里面创建了3台虚拟机, 来保证我的Hadoop完全分布式的最基本配置.我这里选择的CentOS, 因为RedHat系列,在企业中比较的受欢迎.安装好后,最后的环境信息: IP地址 h1: 192.168.230.133 h2: 192.168.230.160 h3: 192.168.230.161 这里遇见到一个小疑问, 就是修改机器的主机名字. vim /etc/sysco

在RHEL 6.5上部署Hadoop 2.6伪分布式模式(单机)

第一步:安装JAVA 1.7               此步骤略过,太简单了,可参考这个: http://blog.sina.com.cn/s/blog_6a7cdcd40101b1j6.html   第二步:创建Haddop专用用户             虽然使用root用户也可以部署hadoop,但从系统安全及规范的角度考虑,还是建议大家创建专用的用户(本例中为hadoop,实际中可以是任意用户名),创建用户的命令: # useradd hadoop # passwd hadoop   

Hadoop集群完全分布式模式环境部署和管理的5大工具

当你利用 Hadoop 进行大数据分析和处理时,首先你需要确保配置.部署和管理集群.这个即不容易也没有什么乐趣,但却受到了开发者们的钟爱.本文提供了5款工具帮助你实现. Apache Ambari Apache Ambari是对Hadoop进行监控.管理和生命周期管理的开源项目.它也是一个为Hortonworks数据平台选择管理组建的项目.Ambari向Hadoop MapReduce.HDFS. HBase.Pig, Hive.HCatalog以及Zookeeper提供服务. Apache M

hadoop 2.4 伪分布式模式

1.core-site.xml 在<configuration></configuration>中插入 <property> <name>fs.default.name</name> <value>hdfs://localhost:9000</value> </property> <property> <name>dfs.replication</name> <valu

Hadoop系列之HBASE(分布式数据库)安装配置

1.hbase安装     cd /root/soft  tar zxvf hbase-0.98.5-hadoop2-bin.tar.gz  mv hbase-0.98.5-hadoop2  /usr/local/hadoop/hbase2.添加环境变量(所有节点都增加)  #vim /etc/profile  export HBASE_HOME=/usr/local/hadoop/hbase  export PATH=$PATH:/usr/local/hadoop/hbase/bin  #so

【HBase基础教程】1、HBase之单机模式与伪分布式模式安装

在这篇blog中,我们将介绍Hbase的单机模式安装与伪分布式的安装方式,以及通过浏览器查看Hbase的用户界面.搭建hbase伪分布式环境的前提是我们已经搭建好了hadoop完全分布式环境,搭建hadoop环境请参考:[Hadoop基础教程]4.Hadoop之完全分布式环境搭建 开发环境 硬件环境:Centos 6.5 服务器4台(一台为Master节点,三台为Slave节点) 软件环境:Java 1.7.0_45.Eclipse Juno Service Release 2.hadoop-1

HBase入门基础教程 HBase之单机模式与伪分布式模式安装

在本篇文章中,我们将介绍Hbase的单机模式安装与伪分布式的安装方式,以及通过浏览器查看Hbase的用户界面.搭建HBase伪分布式环境的前提是我们已经搭建好了Hadoop完全分布式环境,搭建Hadoop环境请参考:[Hadoop入门基础教程]4.Hadoop之完全分布式环境搭建 开发环境 硬件环境:CentOS 6.5 服务器4台(一台为Master节点,三台为Slave节点) 软件环境:Java 1.7.0_45.Eclipse Juno Service Release 2.hadoop-1