Java压缩技术(二) ZIP压缩——Java原生实现

原文:http://snowolf.iteye.com/blog/642298

去年整理了一篇ZLib算法Java实现(Java压缩技术(一) ZLib),一直惦记却没时间补充。今天得空,整理一下ZIP的java原生实现。
看了几篇zip压缩算法的帖子,讲的算是比较细致了,但就是没有对应的解压缩实现,太惜败了! 我就喜欢没事做总结,稍作整理,将其收纳!

相关链接:

Java压缩技术(一) ZLib

Java压缩技术(二) ZIP压缩——Java原生实现

Java压缩技术(三) ZIP解压缩——Java原生实现

Java压缩技术(四) GZIP——Java原生实现

Java压缩技术(五) GZIP相关——浏览器解析

Java压缩技术(六) BZIP2——Commons实现

Java压缩技术(七) TAR——Commons实现

查过相关资料后才知道,ZIP应该算作归档类的压缩算法,每一门学科都可深可浅!

闲言少叙,先说ZIP压缩。

zip压缩需要通过ZipOutputStream 执行write方法将压缩数据写到指定输出流中。

注意,这里应先使用CheckedOutputStream 指定文件校验算法。(通常使用CRC32算法)。代码如下所示:

Java代码  

  1. CheckedOutputStream cos = new CheckedOutputStream(new FileOutputStream(destPath), new CRC32());
  2. ZipOutputStream zos = new ZipOutputStream(cos);

接下来,需要将待压缩文件以ZipEntry的方式追加到压缩文件中,如下所示:

Java代码  

  1. /**
  2. * 压缩包内文件名定义
  3. *
  4. * <pre>
  5. * 如果有多级目录,那么这里就需要给出包含目录的文件名
  6. * 如果用WinRAR打开压缩包,中文名将显示为乱码
  7. * </pre>
  8. */
  9. ZipEntry entry = new ZipEntry(dir + file.getName());
  10. zos.putNextEntry(entry);

ZipEntry就是压缩包中的每一个实体!

完成上述准备后,就可以执行压缩操作了。实际上,就是执行ZipOutputStream类的write方法,如下所示:

Java代码  

  1. BufferedInputStream bis = new BufferedInputStream(new FileInputStream(
  2. file));
  3. int count;
  4. byte data[] = new byte[BUFFER];
  5. while ((count = bis.read(data, 0, BUFFER)) != -1) {
  6. zos.write(data, 0, count);
  7. }
  8. bis.close();

当然,如果待添加的压缩项是一个目录。那么,需要通过递归的方式指定最终的压缩项。

如果要添加一个空目录,注意使用符号"/"(String PATH="/";)作为添加项名字结尾符!

递归构建目录压缩,代码如下:

Java代码  

  1. /**
  2. * 压缩
  3. *
  4. * @param srcFile
  5. *            源路径
  6. * @param zos
  7. *            ZipOutputStream
  8. * @param basePath
  9. *            压缩包内相对路径
  10. * @throws Exception
  11. */
  12. private static void compress(File srcFile, ZipOutputStream zos,
  13. String basePath) throws Exception {
  14. if (srcFile.isDirectory()) {
  15. compressDir(srcFile, zos, basePath);
  16. } else {
  17. compressFile(srcFile, zos, basePath);
  18. }
  19. }
  20. /**
  21. * 压缩目录
  22. *
  23. * @param dir
  24. * @param zos
  25. * @param basePath
  26. * @throws Exception
  27. */
  28. private static void compressDir(File dir, ZipOutputStream zos,
  29. String basePath) throws Exception {
  30. File[] files = dir.listFiles();
  31. // 构建空目录
  32. if (files.length < 1) {
  33. ZipEntry entry = new ZipEntry(basePath + dir.getName() + PATH);
  34. zos.putNextEntry(entry);
  35. zos.closeEntry();
  36. }
  37. for (File file : files) {
  38. // 递归压缩
  39. compress(file, zos, basePath + dir.getName() + PATH);
  40. }
  41. }

x是一个空目录,用WinRAR打开后,可以看到这个目录下还有一个空文件名文件!

来个完整的压缩实现,代码如下所示:

Java代码  

  1. /**
  2. * 2010-4-12
  3. */
  4. package org.zlex.commons.io;
  5. import java.io.BufferedInputStream;
  6. import java.io.BufferedOutputStream;
  7. import java.io.File;
  8. import java.io.FileInputStream;
  9. import java.io.FileOutputStream;
  10. import java.util.zip.CRC32;
  11. import java.util.zip.CheckedInputStream;
  12. import java.util.zip.CheckedOutputStream;
  13. import java.util.zip.ZipEntry;
  14. import java.util.zip.ZipInputStream;
  15. import java.util.zip.ZipOutputStream;
  16. /**
  17. * ZIP压缩工具
  18. *
  19. * @author  <a href="mailto:[email protected]">梁栋</a>
  20. * @since 1.0
  21. */
  22. public class ZipUtils {
  23. public static final String EXT = ".zip";
  24. private static final String BASE_DIR = "";
  25. // 符号"/"用来作为目录标识判断符
  26. private static final String PATH = "/";
  27. private static final int BUFFER = 1024;
  28. /**
  29. * 压缩
  30. *
  31. * @param srcFile
  32. * @throws Exception
  33. */
  34. public static void compress(File srcFile) throws Exception {
  35. String name = srcFile.getName();
  36. String basePath = srcFile.getParent();
  37. String destPath = basePath + name + EXT;
  38. compress(srcFile, destPath);
  39. }
  40. /**
  41. * 压缩
  42. *
  43. * @param srcFile
  44. *            源路径
  45. * @param destPath
  46. *            目标路径
  47. * @throws Exception
  48. */
  49. public static void compress(File srcFile, File destFile) throws Exception {
  50. // 对输出文件做CRC32校验
  51. CheckedOutputStream cos = new CheckedOutputStream(new FileOutputStream(
  52. destFile), new CRC32());
  53. ZipOutputStream zos = new ZipOutputStream(cos);
  54. compress(srcFile, zos, BASE_DIR);
  55. zos.flush();
  56. zos.close();
  57. }
  58. /**
  59. * 压缩文件
  60. *
  61. * @param srcFile
  62. * @param destPath
  63. * @throws Exception
  64. */
  65. public static void compress(File srcFile, String destPath) throws Exception {
  66. compress(srcFile, new File(destPath));
  67. }
  68. /**
  69. * 压缩
  70. *
  71. * @param srcFile
  72. *            源路径
  73. * @param zos
  74. *            ZipOutputStream
  75. * @param basePath
  76. *            压缩包内相对路径
  77. * @throws Exception
  78. */
  79. private static void compress(File srcFile, ZipOutputStream zos,
  80. String basePath) throws Exception {
  81. if (srcFile.isDirectory()) {
  82. compressDir(srcFile, zos, basePath);
  83. } else {
  84. compressFile(srcFile, zos, basePath);
  85. }
  86. }
  87. /**
  88. * 压缩
  89. *
  90. * @param srcPath
  91. * @throws Exception
  92. */
  93. public static void compress(String srcPath) throws Exception {
  94. File srcFile = new File(srcPath);
  95. compress(srcFile);
  96. }
  97. /**
  98. * 文件压缩
  99. *
  100. * @param srcPath
  101. *            源文件路径
  102. * @param destPath
  103. *            目标文件路径
  104. *
  105. */
  106. public static void compress(String srcPath, String destPath)
  107. throws Exception {
  108. File srcFile = new File(srcPath);
  109. compress(srcFile, destPath);
  110. }
  111. /**
  112. * 压缩目录
  113. *
  114. * @param dir
  115. * @param zos
  116. * @param basePath
  117. * @throws Exception
  118. */
  119. private static void compressDir(File dir, ZipOutputStream zos,
  120. String basePath) throws Exception {
  121. File[] files = dir.listFiles();
  122. // 构建空目录
  123. if (files.length < 1) {
  124. ZipEntry entry = new ZipEntry(basePath + dir.getName() + PATH);
  125. zos.putNextEntry(entry);
  126. zos.closeEntry();
  127. }
  128. for (File file : files) {
  129. // 递归压缩
  130. compress(file, zos, basePath + dir.getName() + PATH);
  131. }
  132. }
  133. /**
  134. * 文件压缩
  135. *
  136. * @param file
  137. *            待压缩文件
  138. * @param zos
  139. *            ZipOutputStream
  140. * @param dir
  141. *            压缩文件中的当前路径
  142. * @throws Exception
  143. */
  144. private static void compressFile(File file, ZipOutputStream zos, String dir)
  145. throws Exception {
  146. /**
  147. * 压缩包内文件名定义
  148. *
  149. * <pre>
  150. * 如果有多级目录,那么这里就需要给出包含目录的文件名
  151. * 如果用WinRAR打开压缩包,中文名将显示为乱码
  152. * </pre>
  153. */
  154. ZipEntry entry = new ZipEntry(dir + file.getName());
  155. zos.putNextEntry(entry);
  156. BufferedInputStream bis = new BufferedInputStream(new FileInputStream(
  157. file));
  158. int count;
  159. byte data[] = new byte[BUFFER];
  160. while ((count = bis.read(data, 0, BUFFER)) != -1) {
  161. zos.write(data, 0, count);
  162. }
  163. bis.close();
  164. zos.closeEntry();
  165. }
  166. }

来做个简单的测试:

Java代码  

  1. import static org.junit.Assert.*;
  2. import org.junit.Test;
  3. /**
  4. *
  5. * @author 梁栋
  6. * @version 1.0
  7. * @since 1.0
  8. */
  9. public class ZipUtilsTest {
  10. /**
  11. *
  12. */
  13. @Test
  14. public void test() throws Exception {
  15. // 压缩文件
  16. ZipUtils.compress("d:\\f.txt");
  17. // 压缩目录
  18. ZipUtils.compress("d:\\fd");
  19. }
  20. }

现在用WinRAR打开看看,是不是效果几乎一致?

当然,上述代码有所不足之处主要是中文名称乱码问题。用java原生ZIP实现压缩后得到的压缩包,与系统的字符集不同,文件/目录名将出现乱码。这是所有归档压缩都会遇到的问题。对于这种问题,Commons Copress提供了解决方案!

对于解压缩,请关注后续内容!

时间: 2024-10-13 06:29:57

Java压缩技术(二) ZIP压缩——Java原生实现的相关文章

深入理解java虚拟机(二)HotSpot Java对象创建,内存布局以及访问方式

内存中对象的创建.对象的结构以及访问方式. 一.对象的创建 在语言层面上,对象的创建只不过是一个new关键字而已,那么在虚拟机中又是一个怎样的过程呢? (一)判断类是否加载.虚拟机遇到一条new指令的时候,首先会检查这个指令的参数是否能在常量池中定位到一个类的符号引用,并且检查这个符号代表的类是否被加载.解析并初始化.如果没有完成这个过程,则必须执行相应类的加载. (二)在堆上为对象分配空间.对象需要的空间大小在类加载完成后便能确定.之后便是在堆上为该对象分配固定大小的空间.分配的方式也有两种:

java工具类 文件zip压缩 base64 加密,base64解密 zip解压

package com.cfam.utils; import java.io.BufferedOutputStream; import java.io.ByteArrayInputStream; import java.io.ByteArrayOutputStream; import java.io.File; import java.io.FileInputStream; import java.io.FileOutputStream; import java.io.IOException;

JAVA读书推荐----《深入分析Java Web技术内幕》--《java多线程编程核心技术》--《大型网站技术架构 核心原理与案例分析》-《Effective Java中文版》

(1)  首先推荐的不是一本书,而是一个博客,也是我们博客园另外一位博友java_my_life. 目前市面上讲解设计模式的书很多,虽然我前面讲了看书是最好的,但是对设计模式感兴趣的朋友们,我推荐的是这个博客.这位博友的设计模式讲得非常非常好,我认为90%的内容都是没有问题且很值得学习的,其讲解设计模式的大体路线是: 1.随便开篇点明该设计模式的定义 2.图文并茂讲解该设计模式中的结构 3.以详细的代码形式写一下该种设计模式的实现 4.补充内容 5.讲解该设计模式的优缺点 对于一个设计模式我们关

Java数据类型(二)、Java运算符、流程控制

一.程序写作(创建对象的初始化过程) 1.目的/结果:输出一段话"..." 2.步骤: (1)创建一个基础类,main: (2)创建一块内存空间,用来存储这段话 ①先定义属性,name,sex,age等: ②再定义方法,需要重新创建新的class类,但不需要新的ma方法: (3)调用系统方法/库方法println,实现输出结果 ①在原有的类中创建新对象,将新的class类中的方法调用过来: ②运行,输出所有的内容. //---------------------------------

深入理解java虚拟机(二):java内存溢出实战

按照java内存的结构,发生内存溢出的地方常在于堆.栈.方法区.直接内存. 1.堆溢出 堆溢出原因莫过于对象太多导致,看代码. package baby.oom;     import java.util.ArrayList;   import java.util.List;     /**   * java 堆溢出   * VM Args:-Xms20m -Xmx20m -XX:+HeapDumpOnOutOfMemoryError   * @author   */   public clas

Java学习系列(二十四)Java正则表达式详解

转载请注明出处:http://blog.csdn.net/lhy_ycu/article/details/45501777 前言 正则表达式可以说是用来处理字符串的一把利器,它是一个专门匹配n个字符串的字符串模板,本质是查找和替换.在实例演示之前先了解一下Pattern.Matcher这两个工具类,Pattern:编译好的带匹配的模板(如:Pattern.compile("[a-z]{2}");/ / 取2个小写字母):Matcher:匹配目标字符串后产生的结果(如:pattern.m

再回首,Java温故知新(二):Java关键字

Java中类型和方法名的定义规则很宽松,但也不是可以随意定义,基本的规则为必须是英文字母开头且不能使用Java关键字,这里摘录下书中的附录,具体到每个关键字的用法会在后续的学习中陆续进行实践. 关键字 说明 abstract 标识抽象类或抽象方法 assert 查找内部程序错误 boolean 布尔类型变量 break 跳出switch语句或者循环语句 byte 8位整数类型 case switch开关语句的分支 catch try...catch语句中异常处理部分 char Unicode字符

JAVA随笔篇二(深入分析JAVA简单类型、String和对象的值传递和引用传递)

关于JAVA的值传递和引用传递,翻看了很多资料和博客,感觉大多数讲的很乱,都是自己明白了之后就不讲了的样子,终于算是比较理解这几个概念了,下面做一个总结. 1.简单类型的参数传递 Java方法的参数是简单类型的时候,是按值传递的 (pass by value).下面举一个经典的swap函数: 无法交换值的方法: package TestTransferPack; public class TestTransfer { public static void main(String[] args)

Java加密技术(二)——对称加密算法DES&AES

接下来我们介绍对称加密算法,最常用的莫过于DES数据加密算法. DES DES-Data Encryption Standard,即数据加密算法.是IBM公司于1975年研究成功并公开发表的.DES算法的入口参数有三个:Key.Data.Mode.其中Key为8个字节共64位,是DES算法的工作密钥;Data也为8个字节64位,是要被加密或被解密的数据;Mode为DES的工作方式,有两种:加密或解密. DES算法把64位的明文输入块变为64位的密文输出块,它所使用的密钥也是64位. 通过java

Java加密技术(七)——非对称加密算法最高级ECC

ECC ECC-Elliptic Curves Cryptography,椭圆曲线密码编码学,是目前已知的公钥体制中,对每比特所提供加密强度最高的一种体制.在软件注册保护方面起到很大的作用,一般的序列号通常由该算法产生. 当我开始整理<Java加密技术(二)>的时候,我就已经在开始研究ECC了,但是关于Java实现ECC算法的资料实在是太少了,无论是国内还是国外的资料,无论是官方还是非官方的解释,最终只有一种答案--ECC算法在jdk1.5后加入支持,目前仅仅只能完成密钥的生成与解析. 如果想