搭建Hadoop集群Tips（1）

1 安装版本

搭建Hadoop2.4.0版本，基于Ubuntu12.04 x86_64、jdk1.7.0_79

2 参考文献：

1）可靠安装文档http://www.aboutyun.com/thread-7684-1-1.html

2）官方安装文档http://hadoop.apache.org/docs/r2.4.1/hadoop-project-dist/hadoop-common/ClusterSetup.html#Installation

3 主要思路：

完全分布式集群搭建思路基本是各主机建立SSH无密码通信，安装JDK，安装Hadoop，测试Hadoop等过程。

首先在基于Linux的系统里用户权限是比较容易出错的地方，具体设置可以参考aboutyun论坛相关文献。

本文所有操作均在root用户下完成，实际环境建议在其他用户权限下配置。

4 SSH无密码互连：

SSH无密码登录的原理是将公钥共享，互持公钥的主机之间就可以通过ssh协议无密码登录。

在生成公钥之前需要配置/etc/hostname文件以及/etc/hosts文件

这里搭建的集群为：

10.174.72.4	root/123	master
10.174.72.5	root/123	slave1
10.174.72.6	root/123	slave2
10.174.72.7	root/123	slave3
10.174.72.8	root/123	slave4

分别表示IP地址、用户/密码、主机名称

通过配置/etc/hostname文件修改主机名称

[email protected]:/# vi /etc/hostname

通过配置/etc/hosts文件添加IP地址到主机名称的映射

[email protected]:/# vi /etc/hosts

在各个slave节点完成以上两个文件的修改

常用Linux命令总结

设置SSh具体步骤如下：

第一步：产生密钥

[email protected]:/# ssh-keygen -t rsa

一直按Enter键直到结束

第二步：进入SSH目录，写入公钥

[email protected]:/# cd ~/.ssh/
[email protected]:~/.ssh# cat id_rsa.pub >>authorized_keys

此时可以无密码登录localhost

[email protected]:~/.ssh# ssh localhost

第三步：设置远程无密码登录

通过scp命令将公钥发送到slave1

[email protected]:~/.ssh# cat id_rsa.pub >> master_key
[email protected]:~/.ssh# scp master_key [email protected]:/root/.ssh/

写入authorized_keys

[email protected]:~/.ssh# cat master_key >> authorized_keys

【注意】：每两台机器完成公钥的写入操作

5 主要思路安装JDK

详细安装步骤参考How to Install Oracle Java JDK on Ubuntu Linux

在Ubuntu中安装已编译的软件，一般步骤是解压安装包，修改配置文件，设置PATH环境变量

解压JDK

[email protected]:/usr/local# tar -zxvf jdk-7u79-linux-x64.tar.gz

设置PATH

[email protected]:/usr/local# vi /etc/profile

在文件底部添加

export JAVA_HOME=/usr/local/java/jdk1.7.0_79
export CLASSPATH=.:$JAVA_HOME/lib:$JAVA_HOME/jre/lib
export PATH=$PATH:$JAVA_HOME/bin

通过source命令检查语法

[email protected]:/usr/local# source /etc/profile

如果需要在控制台编译源文件，需要修改CLASSPATH变量，这里不做介绍了

时间： 2024-10-29 19:09:59

搭建Hadoop集群Tips（1）的相关文章

搭建Hadoop集群Tips（3）

7 YARN安装过程在安装HDFS的基础上安装YARN 1)修改mapred-site.xml文件,配置MapReduce <property> <name>mapreduce.framework.name</name> <value>yarn</value> </property> <property> <name>mapreduce.jobhistory.address</name> <

6 HDFS安装过程 1)解压安装包 [email protected]:/usr/local# tar -zxvf hadoop-2.4.0.tar.gz 如果不是使用root用户解压,建议使用chown修改文件夹属性(比如当前用户为xiaoming) [email protected]:/usr/local# sudo chown -R xiaoming:xiaoming hadoop 如果集群是64位操作系统,需要替换lib/native文件夹,否则会出现警告提示 2)修改配置文件主要涉

搭建Hadoop集群 (三)

通过搭建Hadoop集群 (二), 我们已经可以顺利运行自带的wordcount程序. 下面学习如何创建自己的Java应用, 放到Hadoop集群上运行, 并且可以通过debug来调试. 有多少种Debug方式 Hadoop在Eclipse上的Debug方式一般来说, Debug最多的应用场景是调试MR中的代码逻辑, 还有部分是调试main方法中的某些代码逻辑. 无论是Standalone, Pesudo-Distributed, 还是Fully-Distributed Mode, 都可以d

Hadoop入门进阶步步高（五）-搭建Hadoop集群

五.搭建Hadoop集群上面的步骤,确认了单机可以执行Hadoop的伪分布执行,真正的分布式执行无非也就是多几台slave机器而已,配置方面的有一点点区别,配置起来就非常简单了. 1.准备三台服务器 192.168.56.101 192.168.56.102 192.168.56.103 在每台机器的/etc/hosts中都将ip及hostname给映射上: 192.168.56.101 nginx1 192.168.56.102 nginx2 192.168.56.103 nginx3

vmware搭建hadoop集群完整过程笔记

搭建hadoop集群完整过程笔记一.虚拟机和操作系统环境:ubuntu14+hadoop2.6+jdk1.8 虚拟机:vmware12 二.安装步骤: 先在一台机器上配置好jdk和hadoop: 1.新建一个hadoop用户用命令:adduser hadoop 2.为了让hadoop用户有sudo的权限: 用root用户打开sudors文件添加红色框里面的内容: 打开文件: 添加内容: 3.配置jdk,我把jdk的压缩包放在了hadoop的用户目录下,然后也解压在当前目录下修改配置文件(

用Docker在一台笔记本电脑上搭建一个具有10个节点7种角色的Hadoop集群（下）-搭建Hadoop集群

上篇:用Docker在一台笔记本电脑上搭建一个具有10个节点7种角色的Hadoop集群(上)-快速上手Docker 上篇介绍了快速上手Docker部分,下面接着介绍搭建Hadoop集群部分. 六.搭建Hadoop伪分布模式我们先用前面创建的这个容器来搭建Hadoop伪分布模式做测试,测试成功后再搭建完全分布式集群. 1.SSH这个centos容器可以看做是一个非常精简的系统,很多功能没有,需要自己安装.Hadoop需要SSH,但容器没有自带,需要我们安装.①安装SSH # yum -y ins

搭建hadoop集群的linux环境准备

1.修改主机名: 在 root 账号下用命令:vi /etc/sysconfig/network 或sudo vi /etc/sysconfig/network 2.设置系统默认启动级别在 root 账号下输入 vi /etc/inittab 级别改成3 各启动级别代表含义如下: 0 关机 1 单用户系统,不需要登陆 2 多用户系统但不支持NFS,命令行模式登陆 3 完整多用户模式,命令行模式登陆 4 未定义 5 X11图形模式,图形模式登陆 6.重启 3.配置 hadoop 用户 sudo

搭建Hadoop集群需要注意的问题：

搭建Hadoop集群需要注意的问题: 1.检查三台主机名是否正确 2.检查三台IP是否正确 3.检查 /etc/hosts 映射是否正确 4.检查 JDK和Hadoop 是否安装成功(看环境变量配置) 键入 :sudo vi /etc/profile进到文件之后,检查环境变量配置是否正确: 5.检查 SSH免密码登录是否设置成功: [master:主机名server1:第一台从机名server2:第二台从机名] 6.检查 Hadoop配置文件进到hadoop目录下:[注:Nahshon 为用

使用vmware搭建hadoop集群

摘要本文旨在使用Vmware搭建Hadoop集群,如果你使用的是多台独立的.已安装linux操作系统的计算机搭建Hadoop集群的话,请直接从安装Hadoop 开始阅读须知阅读此文之前你需要掌握以下知识,以免文中部分用语令你产生疑惑熟练使用鼠标和键盘在windows操作系统下运行.exe文件访问网页并下载内容在windows操作系统下能够定位到本地资源所在文件夹了解ubuntu是linux的一种发行版,如果你不无法理解发行版的概念,可以简单理解成ubuntu是一种linux. 了