hadoop环境搭建与測试

搭建參看:

http://blog.csdn.net/w13770269691/article/details/16883663/

查看集群状态:

[[email protected] bin]# hdfs dfsadmin -report
Configured Capacity: 36729053184 (34.21 GB)
Present Capacity: 13322559491 (12.41 GB)
DFS Remaining: 13322240000 (12.41 GB)
DFS Used: 319491 (312.00 KB)
DFS Used%: 0.00%
Under replicated blocks: 0
Blocks with corrupt replicas: 0
Missing blocks: 0 

-------------------------------------------------
Datanodes available: 2 (2 total, 0 dead) 

Live datanodes:
Name: 192.168.137.103:50010 (slave2)
Hostname: slave2
Decommission Status : Normal
Configured Capacity: 18364526592 (17.10 GB)
DFS Used: 45056 (44 KB)
Non DFS Used: 11702558720 (10.90 GB)
DFS Remaining: 6661922816 (6.20 GB)
DFS Used%: 0.00%
DFS Remaining%: 36.28%
Last contact: Thu Nov 06 21:26:34 CST 2014 

Name: 192.168.137.102:50010 (slave1)
Hostname: slave1
Decommission Status : Normal
Configured Capacity: 18364526592 (17.10 GB)
DFS Used: 274435 (268.00 KB)
Non DFS Used: 11703934973 (10.90 GB)
DFS Remaining: 6660317184 (6.20 GB)
DFS Used%: 0.00%
DFS Remaining%: 36.27%
Last contact: Thu Nov 06 21:26:31 CST 2014

查看文件块组成:

[[email protected] bin]# hdfs fsck / -files -blocks
Status: HEALTHY
Total size: 219351 B
Total dirs: 11
Total files: 12
Total symlinks: 0
Total blocks (validated): 10 (avg. block size 21935 B)
Minimally replicated blocks: 10 (100.0 %)
Over-replicated blocks: 0 (0.0 %)
Under-replicated blocks: 0 (0.0 %)
Mis-replicated blocks: 0 (0.0 %)
Default replication factor: 1
Average block replication: 1.0
Corrupt blocks: 0
Missing replicas: 0 (0.0 %)
Number of data-nodes: 2
Number of racks: 1
FSCK ended at Thu Nov 06 21:27:34 CST 2014 in 29 milliseconds 

The filesystem under path '/' is HEALTHY
[[email protected] bin]#
[[email protected] hadoop2.2]$

查看各节点状态:

http://192.168.56.101:50070

查看ResourceManager上cluster执行状态:

http://192.168.56.101:8088

在环境搭建的过程中,假设出现不论什么问题。都要去查看日志

日志路径是:/home/hadoop/hadoop2.2/logs

在配置完毕HADOOP_HOME之后,而且使之生效,那么接下来就进行測试,启动hadoop

首先在/文件夹下创建input文件

[[email protected] /]# vim input。在该文件里输入例如以下内容:I am a very good person! I love you America !
将之上传到hdfs上:[[email protected] /]# hadoop fs -put /input /input
在hadoop的bin文件夹下运行:[[email protected] bin]# ./yarn jar ../share/hadoop/mapreduce/hadoop-mapreduce-examples-2.2.0.jar wordcount /input /output
这样运行完成之后能够看到:output文件夹下有两个文件
[[email protected] ~]# hadoop fs -ls /output
Found 2 items
-rw-r--r-- 1 root supergroup 0 2014-11-06 21:21 /output/_SUCCESS
-rw-r--r-- 1 root supergroup 64 2014-11-06 21:21 /output/part-r-00000
接着能够查看Wordcount的统计结果:
[[email protected] bin]# hadoop fs -cat /output/part-r-00000
! 1
America 1
I 2
a 1
am 1
good 1
love 1
person! 1
very 1
you 1
[[email protected] bin]#
时间: 2024-11-08 09:17:05

hadoop环境搭建与測试的相关文章

完全分布式模式的Hadoop环境搭建

一.本文说明:本次测试在五台虚拟机系统上进行完全分布式搭建.Hadoop分布式模式是在多台机器上分布式部署,配置非常类似于伪分布式,名称节点和数据节点都分布在不同的主机上,每台数据节点上都有相应的任务调度. 二.环境说明:       虚拟软件:VM10.0       操作系统:Cent Os 6.7       hadoop版本:hadoop-2.7.2       JDK版本:jdk1.8_77备注:基于独立模式基础上搭建,参考文章:独立模式的Hadoop环境搭建. 三.基本环境配置   

伪分布式模式的Hadoop环境搭建

一.本文说明:     本次测试在一台虚拟机系统上进行伪分布式搭建.Hadoop伪分布式模式是在单机上模拟Hadoop分布式,单机上的分布式并不是真正的伪分布式,而是使 用线程模拟分布式.Hadoop本身是无法区分伪分布式和分布式的,两种配置也很相似.唯一不同的地方是伪分布式是在单机器上配置,数据节点和名字节点均 是一个机器. 二.环境说明:      操作系统:Cent Os 6.7      hadoop版本:hadoop-2.7.2      JDK版本:jdk1.8_77     备注:

hadoop环境搭建之关于NAT模式静态IP的设置 ---VMware12+CentOs7

很久没有更新了,主要是没有时间,今天挤出时间验证了一下,果然还是有些问题的,不过已经解决了,就发上来吧. PS:小豆腐看仔细了哦~ 关于hadoop环境搭建,从单机模式,到伪分布式,再到完全分布式,我们这里就讨论完全分布式,关于搭建工具,有hadoop+CentOs+VMware,感觉各个版本还是有一点差异的. 随后可能会整理出一个常用版本,今天先说说VM的静态IP的设置吧: 关于VM,大家可能不陌生,目前也是windows系统搭建模拟hadoop环境的必要软件之一. 但是,由于有些人会经常改变

Nutch+hadoop环境搭建

以前搭建环境或是配置软件从来都没有留Tips的习惯,但实践证明这是错误的--做过不等于记得怎么做,遇到过的错误也不等于今后就不是错误了.Nutch跟Hadoop的搭建困扰了我很久,但回头看看又觉得真正有些问题的其实就几个关键点,所以觉得花些时间写个简单流程,缅怀一下最近的探索,也希望能给想要搭建Nutch或hadoop的同学提供一些帮助.欢迎大家指正. 想要说明一下的是,虽然说hadoop诞生于nutch,但现在hadoop已经完全独立为一个分布式框架,我们可以简 单地理解为nutch只是跑在h

Hadoop HA + HBase环境搭建(一)————zookeeper和hadoop环境搭建

版本信息: Hadoop 2.6.3 HBase 1.0.3 JDK 1.8 Zookeeper 3.4.9 集群信息: RDFMaster 192.168.0.41 (Hadoop主节点,zk节点,HBase主节点) RDFSlave01 192.168.0.42 (Hadoop备份主节点,从节点,zk节点,HBase的RegionServer) RDFSlave02 192.168.0.43 (从节点,zk节点,HBase的RegionServer) RDFSlave03 192.168.0

在windows搭建jenkins測试环境

jenkins 搭建好开发环境必备之中的一个,简单易用,搭建測试平台非常有帮助,不知道的都能够了解一下 官网下载地址 http://jenkins-ci.org/ 我是下载window版本号的 安装有多种方式,我用了最简单的方式 直接解压文件,然后双击 setup.exe文件.选择安装路径安装,就这样安装完毕了 安装完毕 在浏览器上输入 http://127.0.0.1:8080/ 先新建一个项目.我如今仅仅针对maven 项目,所以我选了第二项.它还有非常多强大的功能,只是对我来说够用了 成功

cocos2d-x 3.0 Android环境搭建(亲測通过)

网上一大堆讲述coco2d-x 3.0 版本号的android环境搭建.真是不忍直視.讲的不清不楚,真是不知道他们自己有没有測试过.今天正好忙完项目有点时间去部署了下android环境. cocos2d-x 3.0 版本号大大简化了android环境的部署,简单到仅仅需一条命令就能够了.好了废话不多说開始进入正题.(我用的引擎是cocos2d-x 3.0 正式版,測试项目是创建的lua项目. 系统为mac) 首先主要的andriod  sdk.ndk自己參照网上配置下.新版3.0须要多配置一下a

分享一些Hadoop环境搭建所用到的软件

本来想用土的掉渣的语言说说hadoop配置的,因为最近总有人问我,环境搭建老出莫名其妙的问题,可是写到一半,还是决定不写了,网上教程好多好多,而大家遇到问题有很多是软件版本不对应造成的,因此我就把大家需要用到的软件给共享一下算了,不用到处去找了.不谢,请叫我活雷锋. 1.虚拟机VMWare10,用这个版本吧,我用过其他几个版本,有的时候会出错. 下载地址:http://yunpan.cn/csmATAd8zQz5W  提取码 cf10 2.CentOS6.5系统 下载地址:http://yunp

hadoop环境搭建与测试

搭建参看: http://blog.csdn.net/w13770269691/article/details/16883663/ 查看集群状态: [[email protected] bin]# hdfs dfsadmin -report Configured Capacity: 36729053184 (34.21 GB) Present Capacity: 13322559491 (12.41 GB) DFS Remaining: 13322240000 (12.41 GB) DFS Us