至HDFS附加内容

在最近的项目开发中遇到的问题:

需要产生良好hdfs文件的其他内容。但使用在线版1.0.3。见发现官方文件,于1.0.4支持的文件的版本号之后append

一下是向hdfs中追加信息的操作方法

假设你仅仅在某一个driver中追加内容信息。不必要对于整个HDFS都开启内容追加:

在某个方法中。追加文件信息:

private void combinerMid(Path input,Path output,Configuration conf){

FileSystem hdfs = null;

conf.setBoolean("dfs.support.append", true);

try{

hdfs = FileSystem.get(conf);

FSDataInputStream in = hdfs.open(input);

FSDataOutputStream out = hdfs.append(output);

IOUtils.copyBytes(in,out,4096,true);

}catch (IOException e){

e.printStackTrace();

}

}

使用以上方法,便能够向output文件里追加input中的文件内容

假设须要开启对于整个HDFS的文件追加内容权限须要在

hdfs-site.xml中添加下面配置

<property>

<name>dfs.support.append</name>

<value>true</value>

</property>

版权声明:本文博主原创文章。博客,未经同意不得转载。

时间: 2024-07-28 15:10:35

至HDFS附加内容的相关文章

SharePoint 2013 附加内容数据库后出现404错误

本文讲述如何解决SharePoint 2013 加内容数据库(Content DataBase)后出现404错误. 笔者按照http://technet.microsoft.com/en-us/library/ff628582(v=office.15).aspx的手动步骤在管理中心站点删除了老的内容数据库并附加了内容数据库. 但是访问站点是出现 404错误. 后来http://social.technet.microsoft.com/Forums/sharepoint/en-US/7c12f55

HDFS文件内容追加(Append) hdfs2.x版支持

HDFS设计之处并不支持给文件追加内容,这样的设计是有其背景的(如果想了解更多关于HDFS的append的曲折实现,可以参考<File Appends in HDFS>:http://blog.cloudera.com/blog/2009/07/file-appends-in-hdfs/),但从HDFS2.x开始支持给文件追加内容,可以参见https://issues.apache.org/jira/browse/HADOOP-8230.可以再看看http://www.quora.com/HD

HDFS配置文件内容解释

识别和定位 fs.defaule.name(core-site.xml) 定义客户端所使用的默认文件系统的URL.默认值为file:/// 这意味着客户访问的是本地Linux文件系统. 但是生产集群HDFS时,希望这个参数来替代   hdfs://hostname:port 这里hostname和port分别代表NameNode守护程序所在的机器和监听的端口. 同时还有这两个作用:通知NameNode需要绑定的IP地址.端口号. 指定DataNode心跳需要发送的目标机器端口. 用到该参数的结点

Sharepoint 的定制 - 代码附加内容编辑器

//来源:http://www.cnblogs.com/codingcow/articles/69143.html Sharepoint是一种非常新而且很有用的技术. 现在微软把基本的功能集成到了Windows 2003 Server里, 那就是Windows Sharepoint Service简称WSS. 他使开发个性化的复杂的应用程序变得非常简单. 在我的经验里, Sharepoint的开发主要分为三部分: 定制(customization), Web Part, 配置和集成. (这里不包

【HDFS】Hadoop分布式文件系统:架构和设计

引言 前提和设计目标 硬件错误 流式数据访问 大规模数据集 简单的一致性模型 "移动计算比移动数据更划算" 异构软硬件平台间的可移植性 Namenode 和 Datanode 文件系统的名字空间 (namespace) 数据复制 副本存放: 最最开始的一步 副本选择 安全模式 文件系统元数据的持久化 通讯协议 健壮性 磁盘数据错误,心跳检测和重新复制 集群均衡 数据完整性 元数据磁盘错误 快照 数据组织 数据块 Staging 流水线复制 可访问性 DFSShell DFSAdmin

ActionBar 中导航菜单、内容提供中和下拉菜单

一.Action View Action视图是一个在ActionBar上作为Action Button 的替代品.要声明一个视图,需要使用 actionLayout 和 actionViewClass 两个属性中的任意一个来分别定义视图的布局资源和布局类. 下面介绍如何定义 Searview 组件: <?xml version="1.0" encoding="utf-8"?> <menu xmlns:android="http://sch

Unity脚本在层级面板中的执行顺序测试4-附加内容

测试4为一些附加内容,后面的各种tips都加在此. 前几篇测试的链接: Unity脚本在层级面板中的执行顺序测试1 http://www.cnblogs.com/hont/p/4298110.html Unity脚本在层级面板中的执行顺序测试2 http://www.cnblogs.com/hont/p/5034419.html Unity脚本在层级面板中的执行顺序测试3 http://www.cnblogs.com/hont/p/5179427.html 1.基本执行顺序 Awake OnEn

Develop -- Training(十四) -- 打印内容

Android 用户经常在他们的设备上查看完整的内容,但是有时候在一个屏幕上不能完全地显示某个人的一些信息.能够打印信息从你的 Android 应用程序给用户看见较大的内容从你的应用程序或者分享其他人的应用程序,但不使用你的应用程序.打印也允许他们创建一个快照信息,而不依赖于有一个设备.足够的电池电量.或者一个无线网连接. 在 Android 4.4 或者更高,该框架提供了打印图片和文档的服务,直接从 Android 应用程序调用.这次培训描述如何打印应用程序,包括印刷图像.HTML页面和创建自

Hadoop 学习之——HDFS

HDFS是HADOOP中的核心技术之一——分布式文件存储系统.Hadoop的作者Doug Cutting 和Mike 是根据Google发布关于GFS 的研究报告所设计出的分布式文件存储系统. 一.HDFS设计的前提或者假设有6个: 硬件错误是常态而不是异常.对于普通的每台机器来说,出现故障可能并是是常事,但HDFS可能由成千上万的机器组成,在这中情况下发生硬件错误就变成非常正常的事情.为了能够正常的工作,HDFS要能处理或者容忍这些硬件错误.所以对HDFS 来说硬件错误是常态而不是错误. 流式