搭建Hadoop集群Tips(1)

1 安装版本

搭建Hadoop2.4.0版本,基于Ubuntu12.04 x86_64、jdk1.7.0_79

2 参考文献:

1)可靠安装文档http://www.aboutyun.com/thread-7684-1-1.html

2)官方安装文档http://hadoop.apache.org/docs/r2.4.1/hadoop-project-dist/hadoop-common/ClusterSetup.html#Installation

3 主要思路:

完全分布式集群搭建思路基本是各主机建立SSH无密码通信,安装JDK,安装Hadoop,测试Hadoop等过程。

首先在基于Linux的系统里用户权限是比较容易出错的地方,具体设置可以参考aboutyun论坛相关文献。

本文所有操作均在root用户下完成,实际环境建议在其他用户权限下配置。

4 SSH无密码互连:

SSH无密码登录的原理是将公钥共享,互持公钥的主机之间就可以通过ssh协议无密码登录。

在生成公钥之前需要配置/etc/hostname文件以及/etc/hosts文件

这里搭建的集群为:

10.174.72.4            root/123             master       
10.174.72.5 root/123 slave1
10.174.72.6 root/123 slave2
10.174.72.7 root/123 slave3
10.174.72.8 root/123 slave4

分别表示IP地址、用户/密码、主机名称

通过配置/etc/hostname文件修改主机名称

[email protected]:/# vi /etc/hostname

通过配置/etc/hosts文件添加IP地址到主机名称的映射

[email protected]:/# vi /etc/hosts

在各个slave节点完成以上两个文件的修改

常用Linux命令总结

设置SSh具体步骤如下:

第一步:产生密钥

[email protected]:/# ssh-keygen -t rsa

一直按Enter键直到结束

第二步:进入SSH目录,写入公钥

[email protected]:/# cd ~/.ssh/
[email protected]:~/.ssh# cat id_rsa.pub >>authorized_keys

此时可以无密码登录localhost

[email protected]:~/.ssh# ssh localhost

第三步:设置远程无密码登录

通过scp命令将公钥发送到slave1

[email protected]:~/.ssh# cat id_rsa.pub >> master_key
[email protected]:~/.ssh# scp master_key [email protected]:/root/.ssh/

写入authorized_keys

[email protected]:~/.ssh# cat master_key >> authorized_keys

【注意】:每两台机器完成公钥的写入操作

5 主要思路安装JDK

详细安装步骤参考How to Install Oracle Java JDK on Ubuntu Linux

在Ubuntu中安装已编译的软件,一般步骤是解压安装包,修改配置文件,设置PATH环境变量

解压JDK

[email protected]:/usr/local# tar -zxvf jdk-7u79-linux-x64.tar.gz

设置PATH

[email protected]:/usr/local# vi /etc/profile

在文件底部添加

export JAVA_HOME=/usr/local/java/jdk1.7.0_79
export CLASSPATH=.:$JAVA_HOME/lib:$JAVA_HOME/jre/lib
export PATH=$PATH:$JAVA_HOME/bin

通过source命令检查语法

[email protected]:/usr/local# source /etc/profile

如果需要在控制台编译源文件,需要修改CLASSPATH变量,这里不做介绍了

时间: 2024-10-29 19:09:59

搭建Hadoop集群Tips(1)的相关文章

搭建Hadoop集群Tips(3)

7 YARN安装过程 在安装HDFS的基础上安装YARN 1)修改mapred-site.xml文件,配置MapReduce <property> <name>mapreduce.framework.name</name> <value>yarn</value> </property> <property> <name>mapreduce.jobhistory.address</name> <

搭建Hadoop集群Tips(2)

6 HDFS安装过程 1)解压安装包 [email protected]:/usr/local# tar -zxvf hadoop-2.4.0.tar.gz 如果不是使用root用户解压,建议使用chown修改文件夹属性(比如当前用户为xiaoming) [email protected]:/usr/local# sudo chown -R xiaoming:xiaoming hadoop 如果集群是64位操作系统,需要替换lib/native文件夹,否则会出现警告提示 2)修改配置文件 主要涉

搭建Hadoop集群 (三)

通过 搭建Hadoop集群 (二), 我们已经可以顺利运行自带的wordcount程序. 下面学习如何创建自己的Java应用, 放到Hadoop集群上运行, 并且可以通过debug来调试. 有多少种Debug方式 Hadoop在Eclipse上的Debug方式 一般来说, Debug最多的应用场景是调试MR中的代码逻辑, 还有部分是调试main方法中的某些代码逻辑. 无论是Standalone, Pesudo-Distributed, 还是Fully-Distributed Mode, 都可以d

Hadoop入门进阶步步高(五)-搭建Hadoop集群

五.搭建Hadoop集群 上面的步骤,确认了单机可以执行Hadoop的伪分布执行,真正的分布式执行无非也就是多几台slave机器而已,配置方面的有一点点区别,配置起来就非常简单了. 1.准备三台服务器 192.168.56.101 192.168.56.102 192.168.56.103 在每台机器的/etc/hosts中都将ip及hostname给映射上: 192.168.56.101  nginx1 192.168.56.102  nginx2 192.168.56.103  nginx3

vmware搭建hadoop集群完整过程笔记

搭建hadoop集群完整过程笔记 一.虚拟机和操作系统 环境:ubuntu14+hadoop2.6+jdk1.8 虚拟机:vmware12 二.安装步骤: 先在一台机器上配置好jdk和hadoop: 1.新建一个hadoop用户 用命令:adduser hadoop 2.为了让hadoop用户有sudo的权限: 用root用户打开sudors文件添加红色框里面的内容: 打开文件: 添加内容: 3.配置jdk,我把jdk的压缩包放在了hadoop的用户目录下,然后也解压在当前目录下 修改配置文件(

用Docker在一台笔记本电脑上搭建一个具有10个节点7种角色的Hadoop集群(下)-搭建Hadoop集群

上篇:用Docker在一台笔记本电脑上搭建一个具有10个节点7种角色的Hadoop集群(上)-快速上手Docker 上篇介绍了快速上手Docker部分,下面接着介绍搭建Hadoop集群部分. 六.搭建Hadoop伪分布模式 我们先用前面创建的这个容器来搭建Hadoop伪分布模式做测试,测试成功后再搭建完全分布式集群. 1.SSH这个centos容器可以看做是一个非常精简的系统,很多功能没有,需要自己安装.Hadoop需要SSH,但容器没有自带,需要我们安装.①安装SSH # yum -y ins

搭建hadoop集群的linux环境准备

1.修改主机名: 在 root 账号下用命令:vi /etc/sysconfig/network 或sudo vi /etc/sysconfig/network 2.设置系统默认启动级别 在 root 账号下输入 vi /etc/inittab  级别改成3 各启动级别代表含义如下: 0 关机 1 单用户系统,不需要登陆 2 多用户系统但不支持NFS,命令行模式登陆 3 完整多用户模式,命令行模式登陆 4 未定义 5 X11图形模式,图形模式登陆 6.重启 3.配置 hadoop 用户 sudo

搭建Hadoop集群需要注意的问题:

搭建Hadoop集群需要注意的问题: 1.检查三台主机名是否正确 2.检查三台IP是否正确 3.检查 /etc/hosts 映射是否正确 4.检查 JDK和Hadoop 是否安装成功(看环境变量配置) 键入 :sudo vi /etc/profile进到文件之后,检查环境变量配置是否正确: 5.检查 SSH免密码登录 是否设置成功: [master:主机名server1:第一台从机名server2:第二台从机名] 6.检查 Hadoop配置文件 进到hadoop目录下:[注:Nahshon 为用

使用vmware搭建hadoop集群

摘要 本文旨在使用Vmware搭建Hadoop集群,如果你使用的是多台独立的.已安装linux操作系统的计算机搭建Hadoop集群的话,请直接从安装Hadoop 开始 阅读须知 阅读此文之前你需要掌握以下知识,以免文中部分用语令你产生疑惑 熟练使用鼠标和键盘 在windows操作系统下运行.exe文件 访问网页并下载内容 在windows操作系统下能够定位到本地资源所在文件夹 了解ubuntu是linux的一种发行版,如果你不无法理解发行版的概念,可以简单理解成ubuntu是一种linux. 了