Hadoop1.2.1分布式安装-2-安装篇

1、在打算做namenode的机器上,wget或其他方式下载hadoop的压缩包,并解压到本地指定目录

下载解压命令参考Linux常用命令

2、配置namenode,修改site文件

  • 修改core-site.xml
<configuration>
  <property>
    <name>fs.default.name</name>
    <value>hdfs://bd01:9000</value>
  </property>
  <property>
    <name>hadoop.tmp.dir</name>
    <value>/home/wukong/a_usr/hadoop-tmp</value>
  </property>
</configuration>

注意:bd01配置的是namenode的主机名。tmp目录必须配置且不能删除,如果删除hadoop的hdfs就没了,必须重新安装。

  • 修改hdfs-site.xml
<configuration>
  <property>
    <name>dfs.replication</name>
    <value>1</value>
  </property>
</configuration>

注意: 文件系统中文件复制的份数,默认是3份。份数越多,越耗费磁盘。一般设置成奇数,方便数据不一致时可以判断正确性。

  • 修改mapred-site.xml
<configuration>
  <property>
    <name>mapred.job.tracker</name>
    <value>bd01:9001</value>
  </property>
</configuration>

3、配置hadoop-env.sh

# The java implementation to use.  Required.
export JAVA_HOME=/usr/lib64/jdk1.7.0_65/

配置JAVA_HOME时将路径指向自己本机上的jdk目录。

4、配置masters和slaves

在masters中加入master的主机名,slaves中加入slaves的主机名。

5、向各个节点复制hadoop

使用scp复制。scp使用方法参考Linux常用命令

6、格式化namenode

bin/hadoop namenode -format

当log中出现info是...has been successfully formated...之后,就算格式化成功了。

7、启动hadoop守护进程

bin/start-all.sh

8、用jps检验各后台进程是否OK

jps

如果有问题,可以修改配置文件,杀死已启动的进程后重新启动hadoop。杀死进程命令参考Linux常用命令。如果没有问题,应该显示有如下几个进程:namenode, secondnamenode, jobtracker。如果在datanode节点上查看进程,则会看到datanode, tasktracker。

Hadoop1.2.1分布式安装-2-安装篇

时间: 2024-08-03 08:20:14

Hadoop1.2.1分布式安装-2-安装篇的相关文章

redis3.0.2 分布式集群安装详细步骤

redis3.0.2 分布式集群安装详细步骤 --(centos5.8 X64系统) 版本历史 时间 版本 说明 编写者 2015-06-5 1.0 redis3.0.2 分布式集群安装详细步骤 csc 一: redis cluster介绍篇 1:redis cluster的现状 目前redis支持的cluster特性(已亲测): 1):节点自动发现 2):slave->master 选举,集群容错 3):Hot resharding:在线分片 4):进群管理:cluster xxx 5):基于

redis3.2.5 分布式集群安装+错误解决过程

redis3.2.5 分布式集群安装详细步骤 --(centos5.X-6.X _X64系统) 版本历史 时间 版本 说明 编写者 2015-06-5 1.0 redis3.0.2 分布式集群安装详细步骤 崔四超 2016-11-25 1.1 redis3.2.5 分布式集群安装详细步骤 崔四超 一: redis cluster介绍篇 1:redis cluster的现状 目前redis支持的cluster特性(已亲测): 1):节点自动发现 2):slave->master 选举,集群容错 3

hadoop完全分布式模式的安装和配置

本文是将三台电脑用路由器搭建本地局域网,系统为centos6.5,已经实验验证,搭建成功. 一.设置静态IP&修改主机名&关闭防火墙(all-root)(对三台电脑都需要进行操作) 0.将三台电脑安装centos6.5系统 1.设置静态ip(便于机器之间的通信,防止路由器电脑重启后,ip变化,导致不能通信) vim /etc/sysconfig/network-scripts/ifcfg-eth0 DEVICE=eth0 #描述网卡对应的设备别名,例如ifcfg-eth0的文件中它为eth

ubuntu12.04+kafka2.9.2+zookeeper3.4.5的分布式集群安装和demo(java api)测试

博文作者:迦壹 博客地址:http://idoall.org/home.php?mod=space&uid=1&do=blog&id=547 转载声明:可以转载, 但必须以超链接形式标明文章原始出处和作者信息及版权声明,谢谢合作! --------------------------------------- 目录: 一.什么是kafka? 二.kafka的官方网站在哪里? 三.在哪里下载?需要哪些组件的支持? 四.如何安装? 五.FAQ 六.扩展阅读 一.什么是kafka? ka

kafka2.9.2的分布式集群安装和demo(java api)测试

目录: 一.什么是kafka? 二.kafka的官方网站在哪里? 三.在哪里下载?需要哪些组件的支持? 四.如何安装? 五.FAQ 六.扩展阅读   一.什么是kafka? kafka是LinkedIn开发并开源的一个分布式MQ系统,现在是Apache的一个孵化项目.在它的主页描述kafka为一个高吞吐量的分布式(能将消息分散到不同的节点上)MQ.Kafka仅仅由7000行Scala编写,据了解,Kafka每秒可以生产约25万消息(50 MB),每秒处理55万消息(110 MB). kafka目

springmvc+mybatis+dubbo分布式平台-window安装zookeeper注册中心

上一篇我们介绍<构建dubbo分布式平台-window安装dubbo管控台>,考虑到我们的开发环境是在window上,为了部署运行方便,今天来简单介绍一下window安装dubbo管控台. dubbo管理控制台开源部分主要包含: 提供者 路由规则 动态配置 访问控制 权重调节 负载均衡 负责人,等管理功能. 下载dubbo管控台war包 解压dubbo.war包 修改dubbo.properties文件 dubbo.registry.address=zookeeper://127.0.0.1:

(转)ZooKeeper伪分布式集群安装及使用

转自:http://blog.fens.me/hadoop-zookeeper-intro/ 前言 ZooKeeper是Hadoop家族的一款高性能的分布式协作的产品.在单机中,系统协作大都是进程级的操作.分布式系统中,服务协作都是跨服务器才能完成的.在ZooKeeper之前,我们对于协作服务大都使用消息中间件,随着分布式系统的普及,用消息中间件完成协作,会有大量的程序开发.ZooKeeper直接面向于分布式系统,可以减少我们自己的开发,帮助我们更好完成分布式系统的数据管理问题. 目录 zook

MFS分布式文件系统之安装部署

MFS分布式文件系统之安装部署 Moose File System 是一个具备容错功能的网络分布式文件系统,它将数据分布在网络中的不同服务器上 管理服务器 (managing server) 负责各个数据存储服务器的管理,文件读写调度,文件空间回收以及恢复.多节点拷贝 元数据日志服务器 (Metalogger server) 负责备份master服务器的变化日志文件,文件类型为changelog_ml.*.mfs,以便于在master server出问题的时候接替其进行工作 数据存储服务器 (d

ZooKeeper伪分布式集群安装

获取ZooKeeper安装包 下载地址:http://apache.dataguru.cn/zookeeper 选择一个稳定版本进行下载,我这里下载的是zookeeper-3.4.6版本. ZooKeeper伪分布式集群安装 伪分布式集群:在一台Server中,启动多个ZooKeeper的实例. 上传并解压安装包 cd /usr rz -by tar xf zookeeper-3.4.6.tar.gz 创建实例配置文件 cd zookeeper-3.4.6/conf cp zoo_sample.