使用伪分布式的方法搭建hadoop

需要用到的软件：CentOS-6.5-x86_64-bin-DVD1.iso

　　　　　　　　jdk-7u55-linux-i586.tar.gz

　　　　　　　　hadoop-2.4.1

　　　　　　　　SecureCRTPortable

1.准备Linux环境
　　1.0先将虚拟机的网络模式选为NAT

　　1.1修改主机名
　　　　vi /etc/sysconfig/network

　　　　NETWORKING=yes
　　　　HOSTNAME=这里输入想要的主机名 ###

　　1.2修改IP
　　　　两种方式：
　　　　　　第一种：通过Linux图形界面进行修改（强烈推荐）
　　　　　　　　进入Linux图形界面 -> 右键点击右上方的两个小电脑 -> 点击Edit connections -> 选中当前网络System eth0 -> 点击edit按钮 -> 选择IPv4 ->

　　　　　　method选择为manual -> 点击add按钮 -> 添加IP：192.168.1.xxx 子网掩码：255.255.255.0 网关：192.168.1.xxx -> apply

　　　　　　第二种：修改配置文件方式（屌丝程序猿专用）
　　　　　　　　vim /etc/sysconfig/network-scripts/ifcfg-eth0

　　　　　　　　　　DEVICE="eth0"
　　　　　　　　　　BOOTPROTO="static" ###
　　　　　　　　　　HWADDR="00:0C:29:3C:BF:E7"
　　　　　　　　　　IPV6INIT="yes"
　　　　　　　　　　NM_CONTROLLED="yes"
　　　　　　　　　　ONBOOT="yes"
　　　　　　　　　　TYPE="Ethernet"
　　　　　　　　　　UUID="ce22eeca-ecde-4536-8cc2-ef0dc36d4a8c"
　　　　　　　　　　IPADDR="192.168.1.xxx" ###
　　　　　　　　　　NETMASK="255.255.255.0" ###
　　　　　　　　　　GATEWAY="192.168.1.xxx" ###

　　1.3修改主机名和IP的映射关系
　　　　vim /etc/hosts

　　　　192.168.1.xxx 之前输入的主机名

　　1.4关闭防火墙
　　　　#查看防火墙状态
　　　　　　service iptables status
　　　　#关闭防火墙
　　　　　　service iptables stop
　　　　#查看防火墙开机启动状态
　　　　　　chkconfig iptables --list
　　　　#关闭防火墙开机启动
　　　　　　chkconfig iptables off

　　　　关闭linux服务器的图形界面：
　　　　　　vi /etc/inittab

　　1.5重启Linux
　　　　reboot

　　2.安装JDK
　　　　2.1使用SecureCRTPortable客户端上传，按下alt+p 后出现sftp窗口，然后put d:\xxx\yy\ll\jdk-7u_65-i585.tar.gz

　　　　2.2解压jdk
　　　　　　#创建文件夹
　　　　　　　　mkdir /home/hadoop/app
　　　　　　#解压
　　　　　　　　tar -zxvf jdk-7u55-linux-i586.tar.gz -C /home/hadoop/app

　　　　2.3将java添加到环境变量中
　　　　　　vim /etc/profile
　　　　　　　　#在文件最后添加
　　　　　　　　　　export JAVA_HOME=/home/hadoop/app/jdk-7u_65-i585
　　　　　　　　　　export PATH=$PATH:$JAVA_HOME/bin

　　　　　　　　#刷新配置
　　　　　　　　　　source /etc/profile

　　3.安装hadoop2.4.1
　　　　先上传hadoop的安装包到服务器上去/home/hadoop/
　　　　　　注意：hadoop2.x的配置文件$HADOOP_HOME/etc/hadoop
　　　　伪分布式需要修改5个配置文件
　　　　3.1配置hadoop
　　　　　　第一个：hadoop-env.sh
　　　　　　　　vim hadoop-env.sh
　　　　　　　　#第27行
　　　　　　　　export JAVA_HOME=/usr/java/jdk1.7.0_65

　　　　　　第二个：core-site.xml

<property>
　　　　　　　　<name>fs.defaultFS</name>
　　　　　　　　<value>hdfs://hdp-1:9000</value>
　　　　　　　　</property>
　　　　　　　　
　　　　　　　　<property>
　　　　　　　　<name>hadoop.tmp.dir</name>
　　　　　　　　<value>/home/hadoop/hadoop-2.4.1/tmp</value>
　　　　　　　　</property>

第三个：hdfs-site.xml
　　　　　　　　
　　　　　　　　<property>
　　　　　　　　<name>dfs.replication</name>
　　　　　　　　<value>2</value>
　　　　　　　　</property>

第四个：mapred-site.xml (mv mapred-site.xml.template mapred-site.xml)
　　　　　　　　mv mapred-site.xml.template mapred-site.xml
　　　　　　　　vim mapred-site.xml
　　　　　　　　
　　　　　　　　<property>
　　　　　　　　<name>mapreduce.framework.name</name>
　　　　　　　　<value>yarn</value>
　　　　　　　　</property>

第五个：yarn-site.xml
　　　　　　　　
　　　　　　　　<property>
　　　　　　　　<name>yarn.resourcemanager.hostname</name>
　　　　　　　　<value>hdp-1</value>
　　　　　　　　</property>
　　　　　　　　
　　　　　　　　<property>
　　　　　　　　<name>yarn.nodemanager.aux-services</name>
　　　　　　　　<value>mapreduce_shuffle</value>
　　　　　　　　</property>

　　　　3.2将hadoop添加到环境变量

　　　　　　vim /etc/proflie
　　　　　　　　export JAVA_HOME=/usr/java/jdk1.7.0_65
　　　　　　　　export HADOOP_HOME=/hadoop/hadoop-2.4.1
　　　　　　　　export PATH=$PATH:$JAVA_HOME/bin:$HADOOP_HOME/bin:$HADOOP_HOME/sbin

　　　　　　source /etc/profile

　　　　3.3格式化namenode（是对namenode进行初始化）
　　　　　　hdfs namenode -format (hadoop namenode -format)

　　　　3.4启动hadoop
　　　　　　先启动HDFS
　　　　　　sbin/start-dfs.sh

　　　　　　再启动YARN
　　　　　　sbin/start-yarn.sh

　　　　3.5验证是否启动成功
　　　　　　使用jps命令验证
　　　　　　　　 NameNode
　　　　　　　　Jps
　　　　　　　　SecondaryNameNode
　　　　　　　　 NodeManager
　　　　　　　　 ResourceManager
　　　　　　　　 DataNode

　　　　　　或者在浏览器中输入以下地址验证：
　　　　　　　　http://192.168.1.101:50070 （HDFS管理界面）
　　　　　　　　http://192.168.1.101:8088 （MR管理界面）

　　4.配置ssh免登陆
　　　　#生成ssh免登陆密钥
　　　　#进入到我的home目录
　　　　　　cd ~/.ssh

　　　　　　ssh-keygen -t rsa （四个回车）
　　　　　　　　执行完这个命令后，会生成两个文件id_rsa（私钥）、id_rsa.pub（公钥）
　　　　　　　　将公钥拷贝到要免密登陆的目标机器上
　　　　　　　　ssh-copy-id localhost

时间： 2024-12-23 09:37:16

使用伪分布式的方法搭建hadoop

使用伪分布式的方法搭建hadoop的相关文章

Hadoop伪分布式集群搭建-此文章在个人51.cto转载

Hadoop伪分布式集群搭建总结

windows下单机版的伪分布式solrCloud环境搭建Tomcat+solr+zookeeper

hadoop伪分布式集群搭建与安装（ubuntu系统）

ZooKeeper的伪分布式集群搭建以及真分布式集群搭建

ZooKeeper的伪分布式集群搭建

zookeeper伪分布式集群搭建

Hadoop伪分布式环境快速搭建

Kafka 单机和伪分布式集群搭建