在ubuntu系统下学装hadoop

1.环境:ubuntu、hadoop2.7.3

2.在Ubuntu下创建hadoop用户组和用户

① 添加hadoop用户到系统用户

② 现在只是添加了一个用户hadoop,它并不具备管理员权限,我们给hadoop用户添加权限,打开/etc/sudoers文件

命令:sudo vi /etc/sudoers

③ 在root  ALL=(ALL:ALL)  ALL下添加hadoop  ALL=(ALL:ALL)  ALL

此文件为只读文件,修改后强制保存::wq!

3.安装ssh服务

命令:sudo apt-get install ssh openssh-server

4.使用ssh进行无密码验证登录

① 先进入hadoop用户

命令: su hadoop

② 作为一个安全通信协议(ssh生成密钥有rsa和dsa两种生成方式,默认情况下采用rsa方式),使用时需要密码,因此我们要设置成免密码登录,生成私钥和公钥:

(注:回车后会在~/.ssh/下生成两个文件:id_rsa和id_rsa.pub这两个文件是成对出现的前者为私钥,后者为公钥)

进入~/.ssh/目录下,将公钥id_rsa.pub追加到authorized_keys授权文件中,开始是没有authorized_keys文件的(authorized_keys 用于保存所有允许以当前用户身份登录到ssh客户端用户的公钥内容):

命令:cat ~/.ssh/id_rsa.pub>> ~/.ssh/authorized_keys

③ 然后即可无密码验证登录了

命令:ssh localhost

5.下载Hadoop安装包

官网地址:

https://mirrors.tuna.tsinghua.edu.cn/apache/hadoop/common/stable/

6.解压缩Hadoop安装包

要确保所有的操作都是在用户hadoop下完成的,所以将该hadoop文件夹的属主用户设为hadoop

命令:sudo chown -R hadoop:hadoop hadoop

7.安装Java

8.配置Hadoop中相应的文件

需要配置的文件如下,hadoop-env.sh,core-site.xml,mapred-site.xml.template,hdfs-site.xml,所有的文件均位于/usr/local/hadoop/etc/hadoop下面,具体需要的配置如下:

① core-site.xml 配置如下:

<configuration>

<property>

<name>hadoop.tmp.dir</name>

<value>file:/usr/local/hadoop/tmp</value>

<description>Abase for other temporary directories.</description>

</property>

<property>

<name>fs.defaultFS</name>

<value>hdfs://localhost:9000</value>

</property>

</configuration>

② mapred-site.xml.template配置如下:

<configuration>

<property>

<name>mapred.job.tracker</name>

<value>localhost:9001</value>

</property>

</configuration>

③ hdfs-site.xml配置如下:

<configuration>

<property>

<name>dfs.replication</name>

<value>1</value>

</property>

<property>

<name>dfs.namenode.name.dir</name>

<value>file:/usr/local/hadoop/tmp/dfs/name</value>

</property>

<property>

<name>dfs.datanode.data.dir</name>

<value>file:/usr/local/hadoop/tmp/dfs/data</value>

</property>

</configuration>

其中dfs.namenode.name.dir和dfs.datanode.data.dir的路径可以自由设置,最好在hadoop.tmp.dir的目录下面。

补充,如果运行Hadoop的时候发现找不到jdk,可以直接将jdk的路径放置在hadoop-env.sh里面,具体如下:

    export JAVA_HOME="/usr/local/jdk1.8.0_91"

9.运行Hadoop

① 初始化HDFS系统

命令:bin/hdfs namenode -format

② 开启NameNode和DataNode守护进程

命令:sbin/start-dfs.sh,成功如下:

③ 查看进程信息

命令:jps

④ 查看Web UI

在浏览器输入http://192.168.86.126:50070/

10.运行WordCount Demo

① 在本地新建一个文件,在/home/download/wangling目录下新建了一个words文档,里面的内容可以随便填写。此words里写的如下:

quux labs foo bar quux

② 在HDFS中新建一个文件夹,用于上传本地的words文档,在hadoop目录下输入如下命令:

命令:bin/hdfs dfs -mkdir /test,表示在hdfs的根目录下建立了一个test目录

使用如下命令可以查看HDFS根目录下的目录结构

命令:bin/hdfs dfs -ls /

③ 将本地words文档上传到test目录中

命令:bin/hdfs dfs -put /home/download/wangling/words /test/

表示已经将本地的words文档上传到了test目录下了。

④ 运行wordcount

命令:bin/hadoop jar share/hadoop/mapreduce/hadoop-mapreduce-examples-2.7.3.jar wordcount /test/words /test/out

运行完成后,在/test目录下生成名为out的文件

查看命令:bin/hdfs dfs -ls /test

⑤ 查看运行结果

命令:bin/hdfs dfs -ls /test/out

bin/hadoop fs -cat /test/out/part-r-00000

时间: 2024-11-29 05:41:50

在ubuntu系统下学装hadoop的相关文章

虚拟机安装的三台Ubuntu系统下搭建Hadoop

在Linux 上安装Hadoop 教程 在虚拟机中安装的Ubuntu系统下搭建Hadoop集群时首先要解决的问题是将宿主机的文件拷贝到虚拟机上.采用的简单方法是宿主机使用Serv-U建立一个FTP然后在虚拟机上登录将文件拷出来. 要先熟悉Linux的基本概念和操作,如:cd.ls.tar.cat.ssh.scp.cp.rm.sudo.su.apt-get等操作. 一.实践环境: Ubuntu10.04+jdk1.6+hadoop-0.20.1 机器名 IP 作用 Master 192.168.1

【Hadoop】在Ubuntu系统下安装Hadoop单机/伪分布式安装

Ubuntu 14.10 前方有坑: 由于之前的分布式系统电脑带不动,所以想换一个伪分布式试一试.用的是Virtualbox + Ubuntu 14.10 .结果遇到了 apt-get 源无法更新的情况,以及安装包安装不全的情况.只好咬一咬牙,又重新把系统给更新一边. apt-get 源无法更新解决方案:传送门 首先先备份源列表: sudo cp /etc/apt/sources.list /etc/apt/sources.list_backup 用编辑器打开: sudo gedit /etc/

在Ubuntu系统上搭建Hadoop 2.x(2.6.2)

官方的中文版的Hadoop快速入门教程已经是很老的版本了,新版的Hadoop目录结构发生了变化,因此一些配置文件的位置也略微调整了,例如新版的hadoop中找不到快速入门中提到的conf目录,另外,网上有很多教程也是关于老版本的.本教程主要是针对Hadoop 2.X版本,在Ubuntu系统上的搭建过程.如果要对各个步骤进行深入理解,还需要参考其他资料. 英文版快速入门:http://hadoop.apache.org/docs/r2.6.2/hadoop-project-dist/hadoop-

怎样在VMware虚拟机中使用安装并设置Ubuntu系统

1 2 3 4 5 6 7分步阅读 Ubuntu 系统是一款优秀的.基于GNU/Linux 的平台的桌面系统. 当然,目前为止很多应用程序还完全不能允许运行在 Ubuntu 系统上,而且 Ubuntu 的界面.使用方法会让大部分Windows 用户感到不适应.为了在正常的 Windows 工作环境中熟悉并体验 Ubuntu 环境,我们选择使用了 VMware 虚拟机环境.此教程适合初次使用 Linux 环境的各类小白. 工具/原料 至少是有一台双核.2GB内存.100GB以上硬盘.带网线的电脑.

虚拟机 VMware Workstation12 安装Ubuntu系统

Ubuntu 系统是一款优秀的.基于GNU/Linux 的平台的桌面系统. 当然,目前为止很多应用程序还完全不能允许运行在 Ubuntu 系统上,而且 Ubuntu 的界面.使用方法会让大部分Windows 用户感到不适应.为了在正常的 Windows 工作环境中熟悉并体验 Ubuntu 环境,我们选择使用了 VMware 虚拟机环境.此教程适合初次使用 Linux 环境的各类小白.(注:如果遇到  "二进制转换与此平台上的长模式不兼容的解决办法" 提示信息,解决办法:https://

[Hadoop] 在Ubuntu系统上一步步搭建Hadoop(单机模式)

1 创建Hadoop用户组和Hadoop用户 Step1:创建Hadoop用户组: ~$ sudo addgroup hadoop Step2:创建Hadoop用户: ~$ sudo adduser -ingroup hadoop hadoop 回车后会提示输入密码,这是新建Hadoop的密码,输入两次密码敲回车即可.如下图所示: Step3:为Hadoop用户添加权限: ~$ sudo gedit /etc/sudoers 点击回车后,打开sudoers文件,在 root ALL=(ALL:A

Ubuntu 13.10装好系统后大配置

安装后的配置,尽量按顺序来吧. 1. 更改软件源 习惯性的改163源了. 软件和更新 -> 下载自 -> 其他站点,http://mirrors.163.com/ubuntu. 顺道顶栏Tab菜单,其它软件,附加驱动,该勾的勾上. 2. update & upgrade 1 sudo apt-get update && sudo apt-get upgrade 3. gnome3   sudo apt-get install gnome-shell 注销,在登录界面选择

[Hadoop入门] - 1 Ubuntu系统 Hadoop介绍 MapReduce编程思想

Ubuntu系统 (我用到版本号是140.4) ubuntu系统是一个以桌面应用为主的Linux操作系统,Ubuntu基于Debian发行版和GNOME桌面环境.Ubuntu的目标在于为一般用户提供一个最新的.同时又相当稳定的主要由自由软件构建而成的操作系统,它可免费使用,并带有社团及专业的支持应. 作为Hadoop大数据开发测试环境, 建议大家不要在windows上安装CgyWin来学习或研究, 直接用Vmware+ubuntu来学习. 下载 www.vmware.com这里下载vmware,

windows10环境下装ubuntu双系统,装显卡驱动,配置CUDA,cudnn环境

1.制作一个ubuntu系统的U盘1.1.下载ubuntu镜像:http://mirrors.163.com/ubuntu-releases/ 下载需要的版本1.2.将下载好的ubuntu镜像解压到u盘,就制作好ubuntu系统的U盘了. 2.用win10自带的磁盘分割器,分割出一部分内存给ubuntu使用2.1.右键'我的电脑'-> '管理' -> '磁盘管理'如果你想在F盘安装ubuntu,则右键F盘 -> '压缩盘', 选择ubuntu需要的空间. 3.安装ubuntu把u盘插到电