Hadoop HDFS NFS GateWay部署深入具体解释

目的：通过挂载的方式，能够相似訪问本地磁盘的方式一样的訪问Hadoop文件。简单、方便、快捷。

0.系统版本号&hadoop版本号

1）系统版本号

[root@WEB-W031 sbin]# cat /etc/issue
CentOS release 5.8 (Final)

2）Hadoop版本号

[[email protected] /]# hadoop version
Hadoop 2.7.2
Subversion https://git-wip-us.apache.org/repos/asf/hadoop.git -r b165c4fe8a74265c792ce23f546c64604acf0e41
Compiled by jenkins on 2016-01-26T00:08Z
Compiled with protoc 2.5.0
From source with checksum d0fda26633fa762bff87ec759ebe689c
This command was run using /home/hadoop/hadoop/share/hadoop/common/hadoop-common-2.7.2.jar
You have new mail in /var/spool/mail/root

1、配置Core-site.xml文件

<property>
  <name>hadoop.proxyuser.hadoop.groups</name>
  <value>*</value>
  <description>
         The ‘nfsserver‘ user is allowed to proxy all members of the ‘users-group1‘ and
         ‘users-group2‘ groups. Note that in most cases you will need to include the
         group "root" because the user "root" (which usually belonges to "root" group) will
         generally be the user that initially executes the mount on the NFS client system.
         Set this to ‘*‘ to allow nfsserver user to proxy any group.
  </description>
</property>

<property>
  <name>hadoop.proxyuser.hadoop.hosts</name>
  <value>*</value>
  <description>
         This is the host where the nfs gateway is running. Set this to ‘*‘ to allow
         requests from any hosts to be proxied.
  </description>

</property>

含义解读：

1）hadoop.proxyuser.hadoop.groups：第二个和运行Hadoop的username一致，本測试用的名称为Hadoop。

2）hadoop.proxyuser.hadoop.hosts：第二个和运行Hadoop的username一致。本測试用的名称为Hadoop。

2、配置hdfs-site.xml文件

     <property>
  <name>dfs.namenode.accesstime.precision</name>
  <value>3600000</value>
  <description>The access time for HDFS file is precise upto this value.
    The default value is 1 hour. Setting a value of 0 disables
    access times for HDFS.
  </description>
</property>

  <property>
    <name>nfs.dump.dir</name>
    <value>/tmp/.hdfs-nfs</value>
  </property>

<property>
  <name>nfs.exports.allowed.hosts</name>
  <value>* rw</value>
</property>

<property>
    <name>nfs.rtmax</name>
    <value>1048576</value>
    <description>This is the maximum size in bytes of a READ request supported by the NFS gateway. If you change this, make sure you also update the nfs mount‘s rsize(add rsize= # of bytes to the mount directive).</description>
</property>

<property>
    <name>nfs.wtmax</name>
    <value>65536</value>
    <description>This is the maximum size in bytes of a WRITE request supported by the NFS gateway. If you change this, make sure you also update the nfs mount‘s wsize(add wsize= # of bytes to the mount directive).</description>
</property>

3、配置*/etc/hadoop/log4j.properties

 log4j.logger.org.apache.hadoop.hdfs.nfs=DEBUG
 log4j.logger.org.apache.hadoop.oncrpc=DEBUG

4、root用户下停止portmap(Centos 5.X系统）。停止nfs


[root@WEB-W031 etc]# service portmap stop
Stopping portmap: [ OK ]
[root@WEB-W031 hadoop]# service nfs stop

注意：5.X的portmap 等价于 6.X上的rpcbind

并通过:service nfs status 验证是否已经结束。

并通过：service portmap status 验证是否已经结束。

5、开启Hadoop的Portmap服务（须要root权限）

[root]> /sbin/hadoop-daemon.sh –script /bin/hdfs start portmap

6、开启Hadoop的Nfs3服务（须要运行Hadoop的用户权限，本系统为Hadoop）

[hadoop]$ /sbin/hadoop-daemon.sh –script /bin/hdfs start nfs3

7、开启Hadoop并验证(须要运行Hadoop的用户权限，本系统为Hadoop）

[[email protected] sbin]# ./start-dfs.sh
[[email protected] sbin]# jps
14728 ResourceManager
27478 Jps
5228 Portmap
14104 NameNode
14373 SecondaryNameNode
16762 org.eclipse.equinox.launcher_1.3.0.v20130327-1440.jar
13512 Nfs3

8、验证NFS相关服务是否启动成功

1）验证各服务是否成功运行

[root@WEB-W031 hadoop]# rpcinfo -p $nfs_server_ip
program vers proto port
100005 2 tcp 4242 mountd
100000 2 udp 111 portmapper
100000 2 tcp 111 portmapper
100005 1 tcp 4242 mountd
100003 3 tcp 2049 nfs
100005 1 udp 4242 mountd
100005 3 udp 4242 mountd
100005 3 tcp 4242 mountd

2）显示挂载路径

[root@WEB-W031 hadoop]# showmount -e $nfs_server_ip
Export list for WEB-W031:
/ *

9、实施挂载

 [root]>mount -t nfs -o vers=3,proto=tcp,nolock,noacl,sync $10.0.1.31:/  /hdfsnew

10、查看挂载是否成功

[root@WEB-W031 hdfsnew]# ls -al
total 10
drwxr-xr-x  5 root   2584148964  160 Mar 11 09:43 .
drwxr-xr-x 31 root   root       4096 Mar 11 10:40 ..
drwxr-xr-x  3 root   root         96 Mar 11 09:58 testing
drwxrwx---  3 hadoop 2584148964   96 Mar  9 11:14 tmp
drwxr-xr-x  3 hadoop 2584148964   96 Mar  9 13:24 user
[root@WEB-W031 hdfsnew]# cd testing/
[root@WEB-W031 testing]# ls -al
total 2
drwxr-xr-x 3 root   root        96 Mar 11 09:58 .
drwxr-xr-x 5 root   2584148964 160 Mar 11 09:43 ..
-rw-rw-r-- 1 hadoop hadoop      18 Mar 11 10:08 dffafdadafasdfaf
[root@WEB-W031 testing]# echo  "testinglaoyang" > testlaoyang
[root@WEB-W031 testing]# ls -al
total 2
drwxr-xr-x 4 root   root       128 Mar 11 18:05 .
drwxr-xr-x 5 root   2584148964 160 Mar 11 09:43 ..
-rw-rw-r-- 1 hadoop hadoop      18 Mar 11 10:08 dffafdadafasdfaf
-rw-r--r-- 1 root   root        15 Mar 11 18:05 testlaoyang

11、訪问效果

12、结束服务

1）NFS3服务结束（必须和启动hadoop用户一致）

[hadoop]$ */sbin/hadoop-daemon.sh --script */bin/hdfs stop nfs3

2）PortMap服务结束（必须为root用户）

[root]> */sbin/hadoop-daemon.sh --script */bin/hdfs start portmap

3）Hadoop结束（必须和启动hadoop用户一致）

“`

[[email protected] sbin]# ./stop-dfs.sh

13、常见问题

java 进程占用了111 端口

[[email protected] etc]# lsof -i:111

COMMAND PID USER FD TYPE DEVICE SIZE/OFF NODE NAME

java 31206 root 474u IPv4 93384812 0t0 TCP *:sunrpc (LISTEN)

java 31206 root 476u IPv4 93384815 0t0 UDP *:sunrpc

“

解决方式：kill -9 31206

错误明细

[[email protected] sbin]# mount -t nfs -o vers=3,proto=tcp,nolock,noacl,sync localhost:/ /hdfs_y

mount.nfs: Input/output error

注意：一定要注意配置文件的细节含义。

解决方式：

http://stackoverflow.com/questions/35910751/hdfs-nfs-gateway-mount-nfs-input-output-error/35935229#35935229

參考：

https://hadoop.apache.org/docs/r2.7.2/hadoop-project-dist/hadoop-hdfs/HdfsNfsGateway.html#Allow_mounts_from_unprivileged_clients

http://tianxingzhe.blog.51cto.com/3390077/1650182

作者：铭毅天下

转载请标明出处，原文地址：http://blog.csdn.net/laoyang360/article/details/50865025

假设感觉本文对您有帮助，请点击‘顶’支持一下，您的支持是我坚持写作最大的动力。谢谢！

时间： 2024-10-12 07:19:48

Hadoop HDFS NFS GateWay部署深入具体解释的相关文章

Hadoop NFS GateWay部署深入详解

目的:通过挂载的方式,可以类似访问本地磁盘的方式一样的访问Hadoop文件,简单.方便.快捷. 0.系统版本&hadoop版本 1)系统版本 [root@WEB-W031 sbin]# cat /etc/issue CentOS release 5.8 (Final) 2)Hadoop版本 [[email protected] /]# hadoop version Hadoop 2.7.2 Subversion https://git-wip-us.apache.org/repos/asf/ha

HDFS NFS Gateway

1.mount hdfs,关闭 linux自带的几个和 hdfs需要启动冲突的服务参考:(1) service nfs stop and service rpcbind stop (2) hadoop portmap or hadoop-daemon.sh start portmap [[email protected] mnt]$ service portmap stop [[email protected] mnt]$ sudo service rpcbind stop [[email p

Hadoop HDFS (3) JAVA访问HDFS

现在我们来深入了解一下Hadoop的FileSystem类.这个类是用来跟Hadoop的文件系统进行交互的.虽然我们这里主要是针对HDFS,但是我们还是应该让我们的代码只使用抽象类FileSystem,这样我们的代码就可以跟任何一个Hadoop的文件系统交互了.在写测试代码时,我们可以用本地文件系统测试,部署时使用HDFS,只需配置一下,不需要修改代码了. 在Hadoop 1.x以后的版本中引入了一个新的文件系统接口叫FileContext,一个FileContext实例可以处理多种文件系统,而

【转】Hadoop HDFS分布式环境搭建

原文地址 http://blog.sina.com.cn/s/blog_7060fb5a0101cson.html Hadoop HDFS分布式环境搭建最近选择给大家介绍Hadoop HDFS系统,因此研究了一下如何在Linux 下配置一个HDFS Clust.小记一下,以备将来进一步研究和记忆. HDFS简介全称 Hadoop Distributed File System, Hadoop分布式文件系统. 根据Google的GFS论文,由Doug Cutting使用JAVA开发的开源项目

Hadoop HDFS源码分析关于数据块的类

Hadoop HDFS源码分析关于数据块的类 1.BlocksMap 官方代码中的注释为: /** * This class maintains the map from a block to its metadata. * block's metadata currently includes blockCollection it belongs to and * the datanodes that store the block. */ BlocksMap数据块映射,管理名字节点上的数据

Hadoop 2.2.0部署安装（笔记，单机安装）

SSH无密安装与配置具体配置步骤: ◎ 在root根目录下创建.ssh目录 (必须root用户登录) cd /root & mkdir .ssh chmod 700 .ssh & cd .ssh ◎ 创建密码为空的 RSA 密钥对: ssh-keygen -t rsa -P "" ◎ 在提示的对称密钥名称中输入 id_rsa将公钥添加至 authorized_keys 中: cat id_rsa.pub >> authorized_keys chmod 6

Hadoop HDFS 基础使用

目录 1.HDFS 前言 ................................................................................................................................... 1 2.HDFS 相关概念和特性 ........................................................................................

3-2 Hadoop伪分布模式配置部署

Hadoop伪分布模式配置部署一.实验介绍 1.1 实验内容 hadoop配置文件介绍及修改 hdfs格式化启动hadoop进程,验证安装 1.2 实验知识点 hadoop核心配置文件文件系统的格式化测试WordCount程序 1.3 实验环境 hadoop2.7.6 CentOS6终端 1.4 适合人群本课程难度为一般,属于初级级别课程,适合具有hadoop基础的用户. 1.5 相关文件 https://pan.baidu.com/s/1a_Pjl8uJ2d_-r1hbN05fWA

数道云大数据平台解决方案，Hadoop + HDFS+Hive+Hbase大数据开发整体架构设计

波若大数据平台(BR-odp)Hadoop + HDFS+Hive+Hbase大数据开发工具剖析: HDFS:分布式.高度容错性文件系统,能提供高吞吐量的数据访问,非常适合大规模数据集上的应用,大规模的波若大数据平台(BR-odp)用户部署上1000台的HDFS集群.数据规模高达50PB以上 HDFS和MR共同组成Hadoop分布式系统体系结构的核心.HDFS在集群上实现了分布式文件系统,MR在集群上实现了分布式计算和任务处理.HDFS在MR任务处理过程中提供了文件操作和存储等支持,MR在HDF