Ubuntu下配置hadoop环境

实现真正的分布式的hadoop,并不是伪分布式的。

一、系统与配置

共准备2台机器搭建Hadoop集群。基于Ubuntu14.04,jdk1.6.0_45,Hadoop1.0.3版本,虚拟机使用VMware10.0

192.168.1.10  NameNode  master (master)

192.168.1.20  DateNode   slave1(Slave) 

我的用户名就hadoop

接下来需要安装一些常用的软件:vim,ssh

sudo apt-get update
sudo apt-get install vim
sudo apt-get install ssh

首先修改本机IP

然后输入以下命令,修改hosts

sudo vim /etc/hosts

接下来设置ssh,实现无密码登陆,输入以下命令,生成秘钥

ssh-keygen -t rsa -P ""

一直按回车就会生成秘钥,然后 在.ssh目录中会生成id_rsa
和id_rsa.pub两个文件,这两个文件分别是SSH的私钥和公钥。

生成authorized_keys文件:cat id_rsa.pub >> authorized_keys实现无密码登陆本地localhost的ssh中,

二、安装hadoop和jdk

解压hadoop的压缩包,我的安装目录是/home/hadoop(这是用户名)/hadoop(这是文件夹)/

     tar -zxvf hadoop1.0.3.tar

解压缩jdk的压缩包,命令类似上面,不过是将文件该名称,这里就不列出来了

然后下来是修改环境变量

sudo vim /etc/profile
export JAVA_HOME = /home/hadoop/hadoop/jdk1.6.0_45
export PATH = $JAVA_HOME/bin:$PATH
export HADOOP_HOME = /home/hadoop/hadoop/hadoop-1.0.3
export PATH = $JAVA_HOME/bin:$HADOOP_HOME/bin:$PATH

别忘了执行
source /etc/profile,让路径立马生效

最后配置hadoop下的conf文件夹中的文件

修改hadoop-env.sh

修改core-site.xml

修改hdfs-site.xml

修改mapred-site.xml

修改masters,和slaves文件,在masters中只写master也就是上面提到的192.168.1.0 ,slaves中填写master和slave。

然后格式化namenode,在hadoop-1.0.3文件中写入下面命令

bin/hadoop namenode -format

对了这里一直没有提到slave的配置,其实特别简单,关闭当前的虚拟机,复制一份刚才的虚拟机文件,然后重亲起名,再次打开,修改用户名和ip就好了,我的Ubuntu名字是一样,只要不在一个盘里就行。

最后在master(用户名,也就是主节点的ubuntu)中输入以下命令,同样也是在hadoop-1.0.3的文件中

bin/start-all.sh

然后输入JPS查看java进程,如果出现以下5个进程,就表示成功(不包括jps)

可以查看网页

已经有两个节点,到此整个hadoop分布式的部署就完成了。

时间: 2024-10-26 02:43:04

Ubuntu下配置hadoop环境的相关文章

ubuntu下配置adb环境变量

ubuntu下配置adb环境变量 ubuntu下配置环境变量有两中方法,/etc下的environment和.bashrc文件,这里介绍.bashrc的用法. 首先 打开终端  输入   vim .bashrc  打开文件 然后写入以下内容 export ANDROID_HOME=/home/zhao/android-sdk-linux export PATH=$PATH:$ANDROID_HOME/platform-tools:$ANDROID_HOME/tools (变量ANDROID_HO

ubuntu下配置rails环境遇到的错误

1.Could not find gem 'sqlite3 (>= 0)' in any of the gem sources listed in you r Gemfile 解决:sudo gem install sqlite3-ruby 2.ERROR:  While executing gem ... (Gem::FilePermissionError)     You don't have write permissions into the /usr/local/lib/ruby/ge

Mac下配置Hadoop环境

下载Hadoop(我下载的是2.8.0版本) 点击此处下载 下载后,使用 tar -zxvf tar包名 解压tar包,解压完成后有这样一个文件出现 修改Hadoop的配置文件 需要修改的配置文件在Hadoop安装路径下的 etc/hadoop中 需要修改的文件包括 hadoop-env.sh core-site.xml hdfs-site.xml mapred-site.xml yarn-site.xml hadoop-env.sh修改内容如下 export JAVA_HOME=/Librar

ubuntu下配置JDK环境变量

配置jdk环境变量: 在启动终端并输入 gedit /etc/profile 在末尾添加一下配置,保存并退出 #set jdk environment export JAVA_HOME=/usr/lib/jvm/jdk1.7.0_21 export CLASSPATH=.:$JAVA_HOME/lib:$JAVA_HOME/jre/lib:$CLASSPATH export PATH=$JAVA_HOME/bin:$JAVA_HOME/jre/bin:$PATH 终端输入一下命令使配置生效 so

ubuntu下配置java环境【转】

转自:http://www.cnblogs.com/fnng/archive/2013/01/30/2883815.html 配置JDK环境 下载 登录oracle的网站去下载JDK7 http://www.oracle.com/technetwork/java/javase/downloads/jdk7-downloads-1880260.html 好吧!在下载之前我们要先选中“Accept License Agreement” 然后,才允许我们下载. 等等有好几个linux版本的 JDK,那

Ubuntu下配置Pyspider环境

Ubuntu 14.04.4 LTS 1.ubuntu 系统自带Python 所以不用安装Python 注:安装前先更新下软件源 命令 :sudo apt-get update 2.开始安装pip 命令:sudo apt-get install python-pip 安装成功后升级下pip 确保pip为最新版本 命令:python -m pip install -U pip 3.安装Pyspider环境依赖 命令:sudo apt-get install python-dev sudo apt-

Linux下配置Hadoop环境

1.准备Linux环境 1.0点击VMware快捷方式,右键打开文件所在位置 -> 双击vmnetcfg.exe -> VMnet1 host-only ->修改subnet ip 设置网段:192.168.1.0 子网掩码:255.255.255.0 -> apply -> ok 回到windows --> 打开网络和共享中心 -> 更改适配器设置 -> 右键VMnet1 -> 属性 -> 双击IPv4 -> 设置windows的IP:1

ubuntu下配置java环境

http://www.oracle.com/technetwork/java/javase/downloads/jdk7-downloads-1880260.html 好吧!在下载之前我们要先选中"Accept License Agreement" 然后,才允许我们下载. 等等有好几个linux版本的 JDK,那么应该选择那个呢?我们先来看看他们有什么不同. x86对应的是32位操作系统下的应用程序,x64对应的是64位操作系统下的应用程序,那我们在下载之前要先确定我的操作系统是32位

Ubuntu下配置交叉编译环境

[email protected]:~$ sudo apt-get update # 如果不安装 gawk subversion wine1.6-dev 编译会报错 [email protected]:~$ sudo apt-get install git-core build-essential libssl-dev libncurses5-dev unzip gawk subversion wine1.6-dev [email protected]-ubuntu:~$ git clone g