[linux]ubuntu下安装hadoop（单机版）

ubuntu版本12.04.3 64位

hadoop是用运行在java虚拟机上的，所以需要先安装jdk，jdk安装配置方法在另一篇博文ubuntu12.04下安装jdk1.7

源码包准备：

我下载的是hadoop-1.2.1.tar.gz,这个版本比较稳定，下载地址可以到官网提供的镜像http://www.apache.org/dyn/closer.cgi/hadoop/common/

1、创建hadoop管理员帐号

直接在终端执行如下命令行：

1 sudo adduser hadoop

然后要求你设置hadoop帐户密码，这个命令是添加一个名为hadoop的标准帐户，我们需要的是管理员帐号

可以直接在图形界面下修改hadoop权限，将鼠标点击右上角的一个人头处，浮现列表，点击“用户账户”，解锁，然后更改为管理员权限

2、安装ssh服务

ssh可以实现远程登录和管理，详细情况请google百度

ubuntu默认并没有安装ssh服务，如果通过ssh链接ubuntu，需要自己手动安装ssh-server。命令行：

1 sudo apt-get install ssh openssh-server

3、ssh无密码验证登录

创建ssh-key，这里我们采用rsa方式，命令行如下：

1 ssh-keygen -t rsa -P ""

出现一个图形，出现的图形就是密码，不用管它

1 cat ~/.ssh/id_rsa.pub >> authorized_keys

然后即可无密码验证登录了，如下：

1 ssh localhost

退出命令行为：

exit

4、解压hadoop源码包

终端下进入hadoop源码包所在目录，使用复制命令把hadoop源码包复制到/home/hadoop下

1 cp hadoop-1.2.1.tar.gz /home/hadoop

然后解压,命令行如下

tar -xzvf *.tag.gz

5、配置hadoop的hadoop/conf下的hadoop-env.sh，core-site.xml，mapred-site.xml，hdfs-site.xml

配置hadoop-1.2.1/conf/hadoop-env.sh，命令行：

1 gedit /home/hadoop/hadoop-1.2.1/conf/hadoop-env.sh

ctrl + f 搜索到JAVA_HOME

把前面的#去掉，加上本系统jdk路径，保存退出

配置hadoop-1.2.1/conf/core-site.xml，命令行：

gedit /home/hadoop/hadoop-1.2.1/conf/core-site.xml

在hadoop新建hadoop_tmp目录，原因是http://blog.csdn.net/bychjzh/article/details/7830508

将如下<configuration> </configuration>之间的添加进入，保存退出

<?xml version="1.0"?>
<?xml-stylesheet type="text/xsl" href="configuration.xsl"?>

<!-- Put site-specific property overrides in this file. -->

<configuration>
        <property>
            <name>fs.default.name</name>
            <value>hdfs://localhost:9000</value>
        </property>
    <property>
          <name>hadoop.tmp.dir</name>
          <value>/home/hadoop/hadoop-1.2.1/hadoop_tmp</value>
         <description>A base for other temporary directories.</description>
    </property>

</configuration>

配置hadoop-1.2.1/conf/mapre-site.xml，命令行：

1 gedit /home/hadoop/hadoop-1.2.1/conf/mapre-site.xml.xml

将如下<configuration> </configuration>之间的添加进入，保存退出

<?xml version="1.0"?>
<?xml-stylesheet type="text/xsl" href="configuration.xsl"?>

<!-- Put site-specific property overrides in this file. -->

<configuration>
    <property>
        <name>mapred.job.tracker</name>
        <value>localhost:9001</value>
    </property>
</configuration>

配置hadoop-1.2.1/conf/hdfs-site.xml，命令行：

1 gedit /home/hadoop/hadoop-1.2.1/conf/hdfs-site.xml

将如下<configuration> </configuration>之间的添加进入，保存退出

<?xml version="1.0"?>
<?xml-stylesheet type="text/xsl" href="configuration.xsl"?>

<!-- Put site-specific property overrides in this file. -->

<configuration>
    <property>
        <name>dfs.replication</name>
        <value>1</value>
    </property>

</configuration>

至此hadoop的安装配置已经完毕，稍后的是hadoop的初次运行操作

6、格式化hdfs文件系统

进入hadoop-1.2.1

/bin/hadoop namenode -format

当你看到下图时

恭喜你，hdsf文件系统格式化成功

7、启动hadoop服务

/bin/start-all.sh

出现如下画面

jps

jps是查看java虚拟机运行的java线程

然后出现如下画面

不计jps，有五个hadoop相关线程，恭喜你，hadoop安装配置成功，运行正常。

然后可以退出hadoop。，以后再用时再启动，导入数据

1 bin/stop-all.sh

以上为个人安装配置经验，写这个教程写了两个小时，比我安装还要耗时，不容易啊，这也是给以后自己看的，写出来才是真正学到。

时间： 2024-10-13 20:43:06

[linux]ubuntu下安装hadoop（单机版）的相关文章

linux -- Ubuntu下安装和配置Apache2

在Ubuntu中安装apache 安装指令:sudo apt-get install apache2 启动和停止apache的文件是:/etc/init.d/apache2 启动命令:sudo apache2ctl -k start (或 server apache2 start) 停止命令:sudo apache2ctl -k stop (或 server apache2 stop) 重新启动:sudo apache2ctl -k restart (或 server apache2 rest

Linux Ubuntu下安装OpenCv2.4.10

参考 http://blog.sina.com.cn/s/blog_53b0956801010lfu.html 捣鼓了一个晚上了,OpenCv还没装好,本来以为看个类似的比如Ubuntu安装OpenCv2.2或者其他的就能安装好,结果发现...我太天真了. 网上使用Ubuntu12.04来装OpenCv还是挺多的,各种版本组合教程,都没能把我的Ubuntu12.04+OpenCv2.4.10 成功合体. 灰心之极到OpenCv官网想下载个OpenCv2.4.0发现没有.... 只好假装屡败屡战了

Linux -- ubuntu下安装程序的三种方法

引言在ubuntu当中,安装应用程序我所知道的有三种方法,分别是apt-get,dpkg安装deb和make install安装源码包三种.下面针对每一种方法各举例来说明. apt-get方法使用apt-get install来安装应用程序算是最常见的一种安装方法了,比如我要安装build-essential这个软件,使用以下,他会帮我把所有的依赖包都一起安装了. sudo apt-get install build-essential 执行上述命令以后,我们可以看到一下信息,The fol

[linux]ubuntu 下安装RMySQL包

http://downloads.mysql.com/docs/connector-odbc-en.pdf http://blog.csdn.net/ixidof/article/details/5958904 http://askubuntu.com/questions/446483/how-to-investigate-mariadb-unixodbc-issue-further http://stackoverflow.com/questions/27030590/is-there-com

Linux Ubuntu下安装配置mysql

检查系统中是否已经安装了mysql: sudo netstat -tap | grep mysql 安装mysql: sudo apt-get install mysql-server sudo apt-get isntall mysql-client sudo apt-get install libmysqlclient-dev 查看mysql版本: mysql --version 登录mysql: mysql -u root -p //登录到本地服务器 mysql -u username -

Linux(Ubuntu)下安装jdk

一.下载 1)可以去官网下载:http://www.oracle.com/technetwork/java/javase/downloads/ea-jsp-142245.html,比较多,眼花~~· 2)分享大家我的网盘:链接: https://pan.baidu.com/s/1i5n8DaH 密码: d3qq 二.解压(解压即后无需安装) 1.将下载完的tar.gz文件放到服务器中某目录下 2.打开xshell或终端,进入该目录.cd /root/soft 3.执行解压命令:sudo tar

Linux(Ubuntu)下安装Angular2

看过angular2官网的,应该都知道可以利用CLI工具快速搭建angular项目,安装cli之前要先安装node.js和npm,并且node.js的版本要在6.9.0以上,npm要在3.0.0以上. 我的node.js和npm都顺利的安装了,但总是在安装angular/cli的时候出错,后来才知道node.js必须安装6.9.4这个版本才可以. 在安装node.js之前,如果没有安装g++和libssl-dev的,按照以下步骤安装: sudo apt-get install g++ sudo

【Hadoop】在Ubuntu系统下安装Hadoop单机/伪分布式安装

Ubuntu 14.10 前方有坑: 由于之前的分布式系统电脑带不动,所以想换一个伪分布式试一试.用的是Virtualbox + Ubuntu 14.10 .结果遇到了 apt-get 源无法更新的情况,以及安装包安装不全的情况.只好咬一咬牙,又重新把系统给更新一边. apt-get 源无法更新解决方案:传送门首先先备份源列表: sudo cp /etc/apt/sources.list /etc/apt/sources.list_backup 用编辑器打开: sudo gedit /etc/

Linux/ubuntu下的boost库安装

我一直都没有写博客的习惯,最近正好在研究linux下的开发(目前也只是粗粗的研究),且用到了boost库,就乘此机会写点什么,最起码记录一下我在安装boost的一些步骤,主要给和我一样的linux开发新手们提供点借鉴(当然如果看到这篇文档的话 ),作者(jwybobo2007). 1.下载boost库这个我就不说啥了,去官网看一下就能下到:www.boost.org ,现在的版本更新到了1.44 2.执行:sudo apt-get install build-essential 不为别的,就是