安装jdk
hadoop最新的版本是2.7.1,编译环境是64位操作系统,最好安装64的虚拟机。我自己是centos7。
安装64位虚拟系统,系统可能会提示找不到64位处理器。可能是本地BIOS设置,没有enable虚拟化。在本地security选项中,打开虚拟化。
下载64位的jdk,我自己是jdk1.8.0_60。
上传jdk-8u60-linux-x64.tar.gz至centos,我这里上传到opt下。
$tar -xzfv jdk-8u60-linux-x64.tar.gz --解压缩
$tar -czfv xx --打包,我这里把打包的选项c,解包的选项x,放在最前,是因为它们是tar命令的主选项,其它是辅助选项。
$cd /ect
$vi profile
添加如下内容:
export JAVA_HOME=/opt/jdk1.8.0_60
export PATH=$PATH:/JAVA_HOME/bin
退出编辑
$reboot
$java -version
安装完成,本地可以写HelloWorld.java小小的测试一下,找找感觉。
安装hadoop
同jdk安装一样,将hadoop-2.7.1.tar.gz上传到centos,解压缩。
$useradd -d /home/hadoop -s /bin/bash hadoop --创建一个单独的hadoop用户
$passwd hadoop --为用户hadoop设置密码
$chown -R hadoop:hadoop hadoop-2.7.1 --将创建人改为hadoop,便于hadoop用户管理
$vi /opt/hadoop/etc/hadoop/hadoop-env.sh --设置一下hadoop环境,JAVA_HOME指定一下
按照官方文档简单测试一下:
$ mkdir input
$ cp etc/hadoop/*.xml input
$ bin/hadoop jar share/hadoop/mapreduce/hadoop-*-examples.jar grep input output ‘dfs[a-z.]+‘