HDFS文件内容追加(Append) hdfs2.x版支持

HDFS设计之处并不支持给文件追加内容,这样的设计是有其背景的(如果想了解更多关于HDFS的append的曲折实现,可以参考《File Appends in HDFS》:http://blog.cloudera.com/blog/2009/07/file-appends-in-hdfs/),但从HDFS2.x开始支持给文件追加内容,可以参见https://issues.apache.org/jira/browse/HADOOP-8230。可以再看看http://www.quora.com/HDFS/Is-HDFS-an-append-only-file-system-Then-how-do-people-modify-the-files-stored-on-HDFS。正如HADOOP-8230所述,只需要将hdfs-site.xml中的以下属性修改为true就行。

<property>
    <name>dfs.support.append</name>
    <value>true</value>
</property>

  目前如何在命令行里面给HDFS文件中追加内容我还没找到相应的方法。但是,我们可以通过Hadoop提供的API实现文件内容追加,如何实现?这里我写了一个简单的测试程序:

package com.wyp;

import org.apache.hadoop.conf.Configuration;
import org.apache.hadoop.fs.FileSystem;
import org.apache.hadoop.fs.Path;
import org.apache.hadoop.io.IOUtils;

import java.io.*;
import java.net.URI;

/**
 * blog: http://www.iteblog.com/
 * Date: 14-1-2
 * Time: 下午6:09
 */
public class AppendContent {
    public static void main(String[] args) {
        String hdfs_path = "hdfs://mycluster/home/wyp/wyp.txt";//文件路径
        Configuration conf = new Configuration();
        conf.setBoolean("dfs.support.append", true);

        String inpath = "/home/wyp/append.txt";
        FileSystem fs = null;
        try {
            fs = FileSystem.get(URI.create(hdfs_path), conf);
            //要追加的文件流,inpath为文件
            InputStream in = new
                  BufferedInputStream(new FileInputStream(inpath));
            OutputStream out = fs.append(new Path(hdfs_path));
            IOUtils.copyBytes(in, out, 4096, true);
        } catch (IOException e) {
            e.printStackTrace();
        }
    }
}

将上面的代码打包成jar(这里我取名为hdfs.jar)文件,然后上传到机器中,比如我上传到我的home目录,在程序运行前,我们来看看HDFS中wyp.txt文件中的内容有什么

[[email protected] ~]$ /home/q/hadoop-2.2.0/bin/hadoop fs                                              -cat /home/wyp/wyp.txt
123456
[[email protected] ~]$

好,我们再来看看/home/wyp/append.txt文件中的内容:

[[email protected] ~]$ vim append.txt
wyp  append test

看完代码中所涉及到的两个文件之后,我们再运行hdfs.jar

[[email protected] ~]$ /home/q/hadoop-2.2.0/bin/hadoop jar                                        hdfs.jar com.wyp.AppendContent

运行完之后,看看wyp.txt内容

[[email protected] ~]$ /home/q/hadoop-2.2.0/bin/hadoop fs                                          -cat /home/wyp/wyp.txt
123456
wyp  append test

好了,wyp.txt文件已经追加了append.txt文件中的内容了。本博客文章除特别声明,全部都是原创!

尊重原创,转载请注明: 转载自过往记忆(http://www.iteblog.com/)
本文链接地址: HDFS文件内容追加(Append)》(http://www.iteblog.com/archives/881)
E-mail:[email protected]    

HDFS文件内容追加(Append) hdfs2.x版支持

时间: 2024-10-09 06:04:31

HDFS文件内容追加(Append) hdfs2.x版支持的相关文章

文件的读写,对文件内容追加操作

读文件 # 指定打开的文件名, 以什么方式打开(r) , 打开文件的编码 f = open("{cp}.txt".format(cp='data'), 'r', encoding='utf-8') # data = f.read() 读取整个文件 # print(data) 输出 for line in f: # 遍历文件的每个行,建议这种方式,内存中只会加载当前行 print(line) # 获取文件的集合 print(f.readlines()) f.close() 写文件 # 写

java对txt文件内容追加

package com.test; import java.io.FileOutputStream; /** * 对txt文件在文本追加内容 * @author Wdnncey * */ public class Append { public static void main(String[] args) throws Exception { // 创建字节输出流对象 // FileOutputStream fos = new FileOutputStream("fos3.txt")

Go文件内容追加问题

今天在用文件追加时,遇到点小问题,一直没法追加,起初是这样的 fp,err1 = os.OpenFile(filename,os.O_APPEND,0666) 上面这个死活加不了,后面改成 fp,err1 = os.OpenFile(filename,os.O_WRONLY| os.O_APPEND,0666) 就是加上O_WRONLY这个就行了,不知道为啥,凡正能追加了. 完全代码如下 func writeUrl(urlList []string){ if len(urlList) == 0

sed 追加文件内容

追加用法总结 1.a 在匹配行后面追加 2.i 在匹配行前面追加 3.r 将文件内容追加到匹配行后面 4.w 将匹配行写入指定文件 在匹配行后面追加 a passwd文件第10行后面追加"Add Line Behind" sed -i '10aAdd Line Behind' passwd passwd文件第10行到第20行,每一行后面都追加"Test Line Behind" sed -i '10,20a Test Line Behind' passwd pass

文件内容操作类-RandomAccessFile

package randomaccessfile.cn; import java.io.File; import java.io.FileNotFoundException; import java.io.IOException; import java.io.RandomAccessFile; /*类 RandomAccessFile * File 是对文件的操作,而 RandomAccessFile是对文件内容的操作 * 此类的实例支持对随机访问文件的读取和写入 * 常用的构造方法: * R

【Flume】flume文件监控的source组件开发,支持断点续传功能

基于flume-ng中原有exec的source类型,通过tail依赖于操作系统去监听文件内容变化,其次,不支持断点续传的功能,特此,自行开发了一个组件,大家可以看看,一起探讨: https://github.com/cwtree/flume-filemonitor-source 望各位不吝指教!

java文件末尾追加内容的两种方式

java 开发中,偶尔会遇到在文件末尾对文件内容进行追加,实际上有多种方式可以实现,简单介绍两种: 一种是通过RandomAccessFile类实现,另一种是通过FileWriter类来实现. 实现方法很简单,没什么可多说的,直接看代码: 1 public static void main(String[] args) throws Exception { 2 File file=new File(filename); 3 RandomAccessFile raf=new RandomAcces

PHP内置函数file_put_content(),将数据写入文件,使用FILE_APPEND 参数进行内容追加

file_put_contents(fileName,data,flags,context) 入参说明: 参数 说明 fileName 要写入数据的文件名 data 要写入的数据.类型可以是 string,array(但不能为多维数组),或者是 stream 资源 flags 可选,规定如何打开/写入文件.可能的值: FILE_USE_INCLUDE_PATH:检查 filename 副本的内置路径 FILE_APPEND:在文件末尾以追加的方式写入数据 LOCK_EX:对文件上锁 contex

(IO流)java中多种方式读文件,追加文件内容,对文件的各种操作

import java.io.BufferedReader; import java.io.File; import java.io.FileInputStream; import java.io.FileReader; import java.io.IOException; import java.io.InputStream; import java.io.InputStreamReader; import java.io.RandomAccessFile; import java.io.R