CentOS7下安装配置 Hadoop 2.8.x, JDK安装, 免密码登录, Hadoop Java示例程序运行

01_note_Hadoop的源起与体系介绍;实施Hadoop集群;CDH家族

解压tar包安装JDK以及环境变量配置

      tar -xzvf jdkxxx.tar.gz to /usr/app/ (自定义app用来存放安装后的app)

java -version 查看目前系统java版本以及环境

rpm -qa | grep java 查看安装包以及依赖

yum -y remove xxxx (删除grep出来的每一个包)

配置环境变量 /etc/profile,配置完之后启用配置source /etc/profile

Note:

         关闭防火墙以避免意外报错(CentOS7使用systemctl命令)

sudo service iptables stop

检查一下状态 sudo chkconfig iptables off

         chkconfig 检查所有服务情况

主机互访问免密码设置 (理解免密码访问方向,copy RSA from A to B, A can access B withou pwd)

ssh-keygen -t rsa

scp .ssh/id_rsa.pub [email protected]:/home/henry/.ssh/authorized_keys

ssh-copy-id -i id_rsa.pub -p 22 [email protected] (copy多个key到authorized_keys实现多台无密码访问)

id_rsa >>  私钥

id_rsa_pub >>  公钥

本机的公钥也需要放进去

hostname 和 IP免密码可能不通用,两种都尝试一下是否成功

Note:

        scp远程copy: scp -r /usr/jdk1.8.0 [email protected]:/usr/ (-r附带copy文件夹内容)

        注意Permission denied情况,如果直接用普通用户写到没有写入权限的path比如/usr,会报错,解决办法是用

        [email protected]写入或者写到\home\user下

        /etc/host 解析主机名为IP地址(需要配置所有相关的master/slave主机)

Install hadoop and configure

download hadoop-2.8.0.tar.gz and extract to /home/henry

cd /etc/hadoop (for version 2.8; /config for version 1.x)

参照2.x:

         http://www.cnblogs.com/edisonchou/p/5929094.html

http://hadoop.apache.org/docs/stable/hadoop-project-dist/hadoop-common/SingleCluster.html

vi hadoop-env.sh file to configure java home

vi core-site.xml

vi hdfs-site.xml

vi yarn-site.xml

vi mapred-site.xml (需要首先重新copy一个:cp mapred-site.xml.template mapred-site.xml)

vi master (配置namenode主机名,2.x中可能只需要配置slaves )

vi slaves (配置datanode主机名,注意删除localhost,否则master本身也会作为datanode)

sudo vi /etc/profile 配置hadoop_home

hadoop namenode -format

启动HADOOP尝试

sbin/start-dfs.sh  可能会需要输入yes继续,注意要回到$才可以

sbin/start-yarn.sh

验证是否启动成功: /usr/jdkxxx/bin/jps (java相关的进程统计,java process state)

web界面访问http://10.0.0.11:50070,或者配置host之后用http://master.henry:50070访问

Note:

         注意需要关闭防火墙systemctl stop firewalld.service (CentOS7)

开机禁用防火墙systemctl disable firewalld.service (CentOS7)

查看防火墙状态systemctl status firewalld.service (CentOS7)

         env - 列出环境变量配置情况

配置Hadoop2.8.1编译环境 - http://blog.csdn.net/bjtudujunlin/article/details/50728581

yum intall svn (!!!注意宿主防火墙可能导致部分网络请求失败,例如Avast)

yum install autoconf automake libtool cmake依赖包

download and install maven

download and install google protoc (需要编译 指定编译后的路径./configure --prefix=/usr/app/protoc)

config /etc/profile

mvn -v ok

protoc --version  ok

    

      svn下载源码编译hadoop

mvn package -DskipTests -Pdist,native,docs -Dtar (-Dtar 附带生成一个.tar 安装包)

      svn checkout http://svn.apache.org/repos/asf/hadoop/common/trunk/  (hadoop trunk 或/common/tags/x.x.x for old

      version)

pom.xml文件中定义了编译之后的存放目录

<outputDirectory>hadoop-dist/target</outputDirectory>

Hadoop1.2.1实验环境运行sample算法

mkdir input

echo "Hello world!" > test1.txt  (echo标准输出到屏幕,> 输出到文件)

echo "Hello hadoop!" > test2.txt

hadoop_home/bin/hadoop fs -ls  (查看hdfs下文件)

hadoop_home/bin/hadoop fs -put ../input ./in (hdfs根目录./就是/user/henry)

hadoop_home/bin/hadoop fs -ls

hadoop_home/bin/hadoop fs -ls ./in/*

hadoop_home/bin/hadoop fs -cat ./in/test1.txt  (试验ok没问题说明hdfs上传ok)

bin/hadoop jar hadoop-example-1.2.1.jar wordcount in out (hadoop内置的sample计算单词数)

hadoop_home/bin/hadoop fs -ls   (产生了out文件夹)

hadoop_home/bin/hadoop fs -ls ./out

hadoop_home/bin/hadoop fs -cat ./out/part-xxx (成功运行一个MapReduce job)

Note:

(如果报错: org.apache.hadoop.mapred.SafeModeException: JobTracker is in safe mode, 关闭安全模式)

hadoop dfsadmin -safemode leave

Hadoop2.8.1实验环境运行sample算法  

    Note:

         貌似先做个MapReduce sample (例如hadoop jar ./share/hadoop/mapreduce/hadoop-mapreduce-

         examples-2.8.1.jar pi 5 5)才可以使用hadoop fs -xxx命令, 例如-ls,-put...

hadoop fs 根目录是/user/henry

(如果报错(could only be replicated to 0 nodes, instead of 1))

!!!防火墙防火墙,systemctl disable firewalld.service, 但是开机重启才会生效禁用,需要先stop

         http://localhost:50070/dfshealth.jsp  for 1.2.1

         http://localhost:50070/dfshealth.html for 2.x (可以查看文件系统hdfs文件)

     http://localhost:50030/jobtracker.jsp  for 1.2.1

         hadoop fs -put(上传)/-get(下载)/-rm/-rmr/   (2.x.x 命令为hdfs dfs -xxx)

         hdfs dfsadmin -report (获取hdfs基本统计信息)

    目前搭建的测试环境

         master-namenode

         slave01-datanode1

         slave02-datanode2

时间: 2024-08-26 10:11:15

CentOS7下安装配置 Hadoop 2.8.x, JDK安装, 免密码登录, Hadoop Java示例程序运行的相关文章

【Hadoop系列】linux下 root用户免密码登录远程主机 ssh

操作环境: CentOS 6.5 操作对象: 用户A主机和远程主机B 正文部分:斜体加粗代表linux指令. linux下 非root用户免密码登录远程主机 ssh请转至此链接:XXXXXXXXXXXXXXXX(暂未写好) 一.远程主机B和用户A都安装openssh 首先我们检查远程主机是否安装openshh和rsync rpm -qa|grep opensshrpm -qa|grep rsync 如果没有返回相关信息代表并未安装,我们用yum指令安装. yum install openssh

Linux 配置ssh 免密码登录

在平常应用中,我们经常会登录到其他主机,比如说服务器,每次都需要用户名和密码. 我们可以通过ssh免密码登录服务器而不需要输入密码. 现在有一台ubuntu的阿里云服务器,称之为 server.  公用ip 地址为:192.168.100.100.  现在开始实现用自己的电脑实现ssh免密码登录到 server中.我的电脑是windows 系统,并且安装了Git.(mac 的原理其实一样) 1. 打开Git Bash 执行以下命令生成 sshkey ssh-keygen -t rsa -C "[

Linux系统下如何配置SSH_Centos7 ssh连接配置 CentOS7下安全配置

转自:http://www.linuxdown.net/install/config/2016/0611/5853.html Linux系统下如何配置SSH_Centos7 ssh连接配置 CentOS7下安全配置SSH 时间:2016-06-11 11:13来源:未知 作者:Linux先生 举报 点击:1804次 SSH 通常是我们进入新伺服器的第一个应用程式,它也取代了telnet 和rsh 成为管理伺服器的最主要介面. SSH 通常是我们进入新伺服器的第一个应用程式,它也取代了telnet

centos7安装最新版git及免密码登录配置

一.安装最新版git (1)安装依赖包 # yum install curl-devel expat-devel gettext-devel openssl-devel zlib-devel # yum install  gcc perl-ExtUtils-MakeMaker (2)卸载旧的git版本 # yum remove git (3)查看最新git版本号 登录https://www.kernel.org/pub/software/scm/git/ 当前最新版为2.9.0 (4)下载&解压

Hadoop分布式模式下SSH免密码登录

1.Hadoop中为什么要配置免密码登录 最近在学习Hadoop,在集群中,Hadoop控制脚本依赖SSH来执行针对整个集群的操作.例如,某个脚本能够终止并重启集群中的所有守护进程.所以,需要安装SSH,但是,SSH远程登陆的时候,需要密码验证,集群中数千台计算机,数千台计算机都需要手工输入密码,这是不太现实的,所以,就需要配置SSH无密码登录. 2.环境 Hadoop中有三个节点,分别是centosNameNode,centosDateNode1,centosDateNode2,我们现在要实现

linux网络配置、环境变量以及JDK安装(CentOS 6.5)

由于需要搭建hadoop平台,但是苦于没有现成可用的linux服务器,只好自己下载了CentOS 6.5从头装起,安装过程中遇到了很多问题,比如网络配置.时钟同步.环境变量配置.以及各种服务的启停,还有jdk的安装等(虽然系统自带JDK,但是本人过于低端,自带的JDK的安装路径都搞不明白,就干脆自己装了一个),时间长了容易忘记,所以在这里写下来作为记录,顺便也分享给与我一样的菜鸟玩家,高手们可以退散了,当然了如果有批评指正小弟跪迎. 新建用户 新安装的linux一般只有root管理员用户,由于我

Emacs安装配置全攻略之一编译安装简单配置

/******************************************************************************************************************************************/ 原创作品,转载时请务必以超链接形式标明文章原始出处:http://blog.csdn.net/gqb_driver/article/details/29407717,作者:gqb666 /***************

安装Hadoop系列 — 安装SSH免密码登录

配置ssh免密码登录 1) 验证是否安装ssh:ssh -version显示如下的话则成功安装了OpenSSH_6.2p2 Ubuntu-6ubuntu0.1, OpenSSL 1.0.1e 11 Feb 2013Bad escape character 'rsion'.否则安装ssh:sudo apt-get install ssh 2)ssh-keygen -t dsa -P '' -f ~/.ssh/id_dsa解释一下,ssh-keygen代表生成密钥;-t(注意区分大小写)表示指定生成

Ubuntu下ssh免密码登录安装

1.首先在本机安装openssh-server和openssh-client. 命令:sudo apt-get install openssh-server openssh-client 2.在检查当前的目录下有没有.ssh这个文件,没有的话就mkdir下. 3.生成公钥与私钥.命令:ssh-keygen -t rsa 4.将.ssh文件中的id_isa_pub复制到其他机器的authorized_keys下.并修改authorized_keys权限为600. 5.ssh nodeXX即可. U