Java读取大文件的操作【转】

转自http://aronlulu.iteye.com/blog/1018370

读取文件大小:1.45G 
第一种,OldIO:

Java代码  

  1. public static void oldIOReadFile() throws IOException{
  2. BufferedReader br = new BufferedReader(new FileReader("G://lily_947.txt"));
  3. PrintWriter pw = new PrintWriter("G://oldIO.tmp");
  4. char[] c = new char[100*1024*1024];
  5. for(;;){
  6. if(br.read(c)!=-1){
  7. pw.print(c);
  8. }else{
  9. break;
  10. }
  11. }
  12. pw.close();
  13. br.close();
  14. }

耗时70.79s

第二种,newIO:

Java代码  

  1. public static void newIOReadFile() throws IOException{
  2. FileChannel read = new RandomAccessFile("G://lily_947.txt","r").getChannel();
  3. FileChannel writer = new RandomAccessFile("G://newIO.tmp","rw").getChannel();
  4. ByteBuffer bb = ByteBuffer.allocate(200*1024*1024);
  5. while(read.read(bb)!=-1){
  6. bb.flip();
  7. writer.write(bb);
  8. bb.clear();
  9. }
  10. read.close();
  11. writer.close();
  12. }

耗时47.24s

第三种,RandomAccessFile:

Java代码  

  1. public static void randomReadFile() throws IOException{
  2. RandomAccessFile read = new RandomAccessFile("G://lily_947.txt","r");
  3. RandomAccessFile writer = new RandomAccessFile("G://random.tmp","rw");
  4. byte[] b = new byte[200*1024*1024];
  5. while(read.read(b)!=-1){
  6. writer.write(b);
  7. }
  8. writer.close();
  9. read.close();
  10. }

耗时46.65

第四种,MappedByteBuffer:

Java代码  

  1. public static void mappedBuffer() throws IOException{
  2. FileChannel read = new FileInputStream("G://lily_947.txt").getChannel();
  3. FileChannel writer = new RandomAccessFile("G://buffer.tmp","rw").getChannel();
  4. long i = 0;
  5. long size = read.size()/30;
  6. ByteBuffer bb,cc = null;
  7. while(i<read.size()&&(read.size()-i)>size){
  8. bb = read.map(FileChannel.MapMode.READ_ONLY, i, size);
  9. cc = writer.map(FileChannel.MapMode.READ_WRITE, i, size);
  10. cc.put(bb);
  11. i+=size;
  12. bb.clear();
  13. cc.clear();
  14. }
  15. bb = read.map(FileChannel.MapMode.READ_ONLY, i, read.size()-i);
  16. cc.put(bb);
  17. bb.clear();
  18. cc.clear();
  19. read.close();
  20. writer.close();
  21. }

耗时:36

前三种读法对应的资源占用图如下: 
相对于最后一种内存直接映射方式前面的测试其实无意义,基本秒杀。。。。。 
对于很大的文件直接分块映射时内存会不够,这是因为MappedByteBuffer未被释放造成的,sun未提供直接回收MappedByteBuffer区域的方法,这个时候有两种方法解决,第一种比较愚笨的:

Java代码  

  1. System.gc();
  2. System.runFinalization();
  3. try {
  4. Thread.sleep(3000);
  5. } catch (InterruptedException e) {
  6. e.printStackTrace();
  7. }

第二种网上找来的,利用反射调用clean方法:

Java代码  

  1. public static void unmap(final MappedByteBuffer buffer) {
  2. if (buffer == null) {
  3. return;
  4. }
  5. AccessController.doPrivileged(new PrivilegedAction<Object>() {
  6. public Object run() {
  7. try {
  8. Method getCleanerMethod = buffer.getClass().getMethod("cleaner", new Class[0]);
  9. if (getCleanerMethod != null) {
  10. getCleanerMethod.setAccessible(true);
  11. Object cleaner = getCleanerMethod.invoke(buffer, new Object[0]);
  12. Method cleanMethod = cleaner.getClass().getMethod("clean", new Class[0]);
  13. if (cleanMethod != null) {
  14. cleanMethod.invoke(cleaner, new Object[0]);
  15. }
  16. }
  17. } catch (Exception e) {
  18. e.printStackTrace();
  19. }
  20. return null;
  21. }
  22. });
  23. }

以上两种方法感觉都别扭,还有就是可以自己分割成物理文件再循环调用,这个也不太美观。 
速度也会减慢好多。

时间: 2024-11-17 18:27:59

Java读取大文件的操作【转】的相关文章

java读取 500M 以上文件,java读取大文件

java 读取txt,java读取大文件 设置缓存大小BUFFER_SIZE ,Config.tempdatafile是文件地址 来源博客http://yijianfengvip.blog.163.com/blog/static/175273432201191354043148/ package com.yjf.util;import java.io.File;import java.io.RandomAccessFile;import java.nio.MappedByteBuffer;imp

java读取大文件 超大文件的几种方法

计算机技术学习用书: 编程技术资料:http://myitbook.taobao.com/  电脑技术群:291644908    用技术改变人生,欢迎您的加入 java 读取一个巨大的文本文件既能保证内存不溢出又能保证性能 2010-09-25 11:18:50|  分类: 默认分类 |字号 订阅 import java.io.BufferedReader; import java.io.File; import java.io.FileReader; import java.io.Rando

Java读取大文件的高效率实现

1.概述 本教程将演示如何用Java高效地读取大文件.这篇文章是Baeldung (http://www.baeldung.com/) 上“Java——回归基础”系列教程的一部分. 2.在内存中读取 读取文件行的标准方式是在内存中读取,Guava 和Apache Commons IO都提供了如下所示快速读取文件行的方法: Files.readLines(new File(path), Charsets.UTF_8); FileUtils.readLines(new File(path)); 这种

解决java读取大文件内存溢出问题、如何在不重复读取与不耗尽内存的情况下处理大文件

1.传统的在内存中读取 读取文件行的标准方式是在内存中读取,Guava 和Apache Commons IO都提供了如下所示快速读取文件行的方法: 1 2 3 Files.readLines(new File(path), Charsets.UTF_8); FileUtils.readLines(new File(path)); 这种方法带来的问题是文件的所有行都被存放在内存中,当文件足够大时很快就会导致程序抛出OutOfMemoryError 异常. 例如:读取一个大约1G的文件: 1 2 3

Java读取大文件

1. 在内存中读取 文件的所有行都被存放在内存中,当文件足够大时很快就会导致程序抛出OutOfMemoryError 异常. 2. 使用文件流读取 使用java.util.Scanner类扫描文件的内容,一行一行连续地读取. 3. 使用Apache Common IO流 使用Commons IO库实现,利用该库提供的自定义LineIterator. 4. RandomAccessFile 操作动态文件 分析日志系统,多线程操作同一文件更高效,方便.

java 读取txt,java读取大文件

package com.bbcmart.util; import java.io.File;import java.io.RandomAccessFile;import java.nio.MappedByteBuffer;import java.nio.channels.FileChannel; public class Test {    public static void main(String[] args) throws Exception {        final int BUF

Java多线程读取大文件

前言 今天是五一假期第一天,按理应该是快乐玩耍的日子,但是作为一个北漂到京师的开发人员,实在难想出去那玩耍.好玩的地方比较远,近处又感觉没意思.于是乎,闲着写篇文章,总结下昨天写的程序吧. 昨天下午朋友跟我聊起,他说有个需求,需要把上G的txt文件读取写入到数据库.用普通的io结果自然是OOM了,所以果断用NIO技术.为了提高速度,自然还得用上多线程技术. 接下来就介绍一下实现思路以及相关的知识点. 内容 一.对文件分区 为了充分利用多线程读取,就需要把文件划分成多个区域,供每个线程读取.那么就

java filechannel大文件的读写

java读取大文件 超大文件的几种方法 转自:http://wgslucky.blog.163.com/blog/static/97562532201332324639689/ java 读取一个巨大的文本文件既能保证内存不溢出又能保证性能 2010-09-25 11:18:50|  分类: 默认分类 |字号 订阅 import java.io.BufferedReader; import java.io.File; import java.io.FileReader; import java.

java大文件读写操作,java nio 之MappedByteBuffer,高效文件/内存映射

java处理大文件,一般用BufferedReader,BufferedInputStream这类带缓冲的Io类,不过如果文件超大的话,更快的方式是采用MappedByteBuffer. MappedByteBuffer是java nio引入的文件内存映射方案,读写性能极高.NIO最主要的就是实现了对异步操作的支持.其中一种通过把一个套接字通道(SocketChannel)注册到一个选择器(Selector)中,不时调用后者的选择(select)方法就能返回满足的选择键(SelectionKey