Hadoop集群启动、初体验

1．启动方式
要启动Hadoop集群，需要启动HDFS和YARN两个集群。
注意：首次启动HDFS时，必须对其进行格式化操作。本质上是一些清理和准备工作，因为此时的HDFS在物理上还是不存在的。
hdfs namenode–format或者hadoop namenode –format
1.1．单节点逐个启动
在主节点上使用以下命令启动HDFS NameNode：
hadoop-daemon.sh start namenode
在每个从节点上使用以下命令启动HDFS DataNode：
hadoop-daemon.sh start datanode
在主节点上使用以下命令启动YARN ResourceManager：
yarn-daemon.sh start resourcemanager
在每个从节点上使用以下命令启动YARN nodemanager：
yarn-daemon.sh start nodemanager
以上脚本位于$HADOOP_PREFIX/sbin/目录下。如果想要停止某个节点上某个角色，只需要把命令中的start改为stop即可。
1.2．脚本一键启动
如果配置了etc/hadoop/slaves和ssh免密登录，则可以使用程序脚本启动所有Hadoop两个集群的相关进程，在主节点所设定的机器上执行。
hdfs：$HADOOP_PREFIX/sbin/start-dfs.sh
yarn: $HADOOP_PREFIX/sbin/start-yarn.sh
停止集群：stop-dfs.sh、stop-yarn.sh
2．集群web-ui
一旦Hadoop集群启动并运行，可以通过web-ui进行集群查看，如下所述：
NameNode http://nn_host:port/ 默认50070.
ResourceManager http://rm_host:port/ 默认 8088.

3． Hadoop初体验3.1． HDFS使用
从Linux本地上传一个文本文件到hdfs的/test/input目录下
hadoop fs -mkdir -p /wordcount/input
hadoop fs -put /root/somewords.txt /test/input
3.2．运行mapreduce程序
在Hadoop安装包的hadoop-2.7.4/share/hadoop/mapreduce下有官方自带的mapreduce程序。我们可以使用如下的命令进行运行测试。
示例程序jar:
hadoop-mapreduce-examples-2.7.4.jar
计算圆周率:
hadoop jar hadoop-mapreduce-examples-2.7.4.jar pi 20 50
关于圆周率的估算，感兴趣的可以查询资料Monte Carlo方法来计算Pi值。

原文地址：http://blog.51cto.com/13587708/2169979

时间： 2024-12-11 06:13:23

Hadoop集群启动、初体验

Hadoop集群启动、初体验的相关文章

Hadoop集群启动之后,datanode节点未正常启动的问题

hadoop集群启动ssh免密登录

格式化hdfs后，hadoop集群启动hdfs，namenode启动成功，datanode未启动

Hadoop集群大数据平台搭建

大数据系列（2）——Hadoop集群坏境CentOS安装

大数据——Hadoop集群坏境CentOS安装

二、Hadoop集群

大数据-Hadoop生态(4)-Hadoop集群搭建

大数据学习初体验：Linux学习+Shell基础编程+hadoop集群部署