【转】Java计算文件的hash值

原文地址:http://blog.csdn.net/qq_25646191/article/details/78863110

如何知道一个文件是否改变了呢?当然是用比较文件hash值的方法,文件hash又叫文件签名,文件中哪怕一个bit位被改变了,文件hash就会不同。

比较常用的文件hash算法有MD5和SHA-1。
我用的是MD5算法,java中,计算MD5可以用MessageDigest这个类。

下面是代码:

[java] view plain copy

  1. package com.test;
  2. import java.io.FileInputStream;
  3. import java.io.FileNotFoundException;
  4. import java.io.InputStream;
  5. import java.math.BigInteger;
  6. import java.security.MessageDigest;
  7. public class MD5Util {
  8. public static void main(String[] args) {
  9. try {
  10. //此处我测试的是我本机jdk源码文件的MD5值
  11. String filePath = "C:\\Program Files\\Java\\jdk1.7.0_45\\src.zip";
  12. String md5Hashcode = md5HashCode(filePath);
  13. String md5Hashcode32 = md5HashCode32(filePath);
  14. System.out.println(md5Hashcode + ":文件的md5值");
  15. System.out.println(md5Hashcode32+":文件32位的md5值");
  16. //System.out.println(-100 & 0xff);
  17. } catch (FileNotFoundException e) {
  18. e.printStackTrace();
  19. }
  20. }
  21. /**
  22. * 获取文件的md5值 ,有可能不是32位
  23. * @param filePath  文件路径
  24. * @return
  25. * @throws FileNotFoundException
  26. */
  27. public static String md5HashCode(String filePath) throws FileNotFoundException{
  28. FileInputStream fis = new FileInputStream(filePath);
  29. return md5HashCode(fis);
  30. }
  31. /**
  32. * 保证文件的MD5值为32位
  33. * @param filePath  文件路径
  34. * @return
  35. * @throws FileNotFoundException
  36. */
  37. public static String md5HashCode32(String filePath) throws FileNotFoundException{
  38. FileInputStream fis = new FileInputStream(filePath);
  39. return md5HashCode32(fis);
  40. }
  41. /**
  42. * java获取文件的md5值
  43. * @param fis 输入流
  44. * @return
  45. */
  46. public static String md5HashCode(InputStream fis) {
  47. try {
  48. //拿到一个MD5转换器,如果想使用SHA-1或SHA-256,则传入SHA-1,SHA-256
  49. MessageDigest md = MessageDigest.getInstance("MD5");
  50. //分多次将一个文件读入,对于大型文件而言,比较推荐这种方式,占用内存比较少。
  51. byte[] buffer = new byte[1024];
  52. int length = -1;
  53. while ((length = fis.read(buffer, 0, 1024)) != -1) {
  54. md.update(buffer, 0, length);
  55. }
  56. fis.close();
  57. //转换并返回包含16个元素字节数组,返回数值范围为-128到127
  58. byte[] md5Bytes  = md.digest();
  59. BigInteger bigInt = new BigInteger(1, md5Bytes);//1代表绝对值
  60. return bigInt.toString(16);//转换为16进制
  61. } catch (Exception e) {
  62. e.printStackTrace();
  63. return "";
  64. }
  65. }
  66. /**
  67. * java计算文件32位md5值
  68. * @param fis 输入流
  69. * @return
  70. */
  71. public static String md5HashCode32(InputStream fis) {
  72. try {
  73. //拿到一个MD5转换器,如果想使用SHA-1或SHA-256,则传入SHA-1,SHA-256
  74. MessageDigest md = MessageDigest.getInstance("MD5");
  75. //分多次将一个文件读入,对于大型文件而言,比较推荐这种方式,占用内存比较少。
  76. byte[] buffer = new byte[1024];
  77. int length = -1;
  78. while ((length = fis.read(buffer, 0, 1024)) != -1) {
  79. md.update(buffer, 0, length);
  80. }
  81. fis.close();
  82. //转换并返回包含16个元素字节数组,返回数值范围为-128到127
  83. byte[] md5Bytes  = md.digest();
  84. StringBuffer hexValue = new StringBuffer();
  85. for (int i = 0; i < md5Bytes.length; i++) {
  86. int val = ((int) md5Bytes[i]) & 0xff;//解释参见最下方
  87. if (val < 16) {
  88. /**
  89. * 如果小于16,那么val值的16进制形式必然为一位,
  90. * 因为十进制0,1...9,10,11,12,13,14,15 对应的 16进制为 0,1...9,a,b,c,d,e,f;
  91. * 此处高位补0。
  92. */
  93. hexValue.append("0");
  94. }
  95. //这里借助了Integer类的方法实现16进制的转换
  96. hexValue.append(Integer.toHexString(val));
  97. }
  98. return hexValue.toString();
  99. } catch (Exception e) {
  100. e.printStackTrace();
  101. return "";
  102. }
  103. }
  104. /**
  105. * 方法md5HashCode32 中     ((int) md5Bytes[i]) & 0xff   操作的解释:
  106. * 在Java语言中涉及到字节byte数组数据的一些操作时,经常看到 byte[i] & 0xff这样的操作,这里就记录总结一下这里包含的意义:
  107. * 1、0xff是16进制(十进制是255),它默认为整形,二进制位为32位,最低八位是“1111 1111”,其余24位都是0。
  108. * 2、&运算: 如果2个bit都是1,则得1,否则得0;
  109. * 3、byte[i] & 0xff:首先,这个操作一般都是在将byte数据转成int或者其他整形数据的过程中;使用了这个操作,最终的整形数据只有低8位有数据,其他位数都为0。
  110. * 4、这个操作得出的整形数据都是大于等于0并且小于等于255的
  111. */
  112. }

运行结果如下图:

PS:其实还有一个重点,就是如何知道自己生成的MD5值是否正确呢?

方法很多,其实有一个挺简单的方法,不需要另外安装什么软件。

使用windows自带的命令即可:certutil -hashfile [文件路径] MD5,

例子如下:

原文地址:https://www.cnblogs.com/dirgo/p/8350645.html

时间: 2024-10-21 18:53:01

【转】Java计算文件的hash值的相关文章

Linux下C语言计算文件的md5值(32位的)

google了好久都没有找到合适的,其实我只需要一个函数,能计算文件的 md5 值就好, 后来找到了 md5.h 和 md5.c 的源文件,仿照别人的封装了个函数(他那个有问题,和 md5sum 计算出来的都不一样). 废话少说,直接贴代码: (再废一句话,如果只想计算字符串的md5值,把字符串传给 MD5Update 函数一次就好) #include "md5.h" #include <stdio.h> #include <stdlib.h> #include

C# 计算文件的SHA256值

static void Main(string[] args) { Console.WriteLine(SHA256File(@"C:\BaiduYunDownload\66666.jpg")); } /// 计算文件的 SHA256 值 /// </summary> /// <param name="fileName">要计算 SHA256 值的文件名和路径</param> /// <returns>SHA256值1

计算文件的MD5值(Java &amp; Rust)

Java public class TestFileMD5 { public final static String[] hexDigits = { "0", "1", "2", "3", "4", "5", "6", "7", "8", "9", "a", "b",

Java计算文件MD5值代码

原文:http://www.open-open.com/code/view/1424930488031 import java.io.File; import java.io.FileInputStream; import java.io.IOException; import java.nio.MappedByteBuffer; import java.nio.channels.FileChannel; import java.security.MessageDigest; import ja

用Python计算文件的MD5值

尽管计算MD5有很多小工具,重装系统后还得去找,就自己用Python写了一个: getMD5.py import hashlib import sys if __name__ == '__main__': if len(sys.argv)!= 2: sys.exit('argv error!') m = hashlib.md5() n = 1024*4 inp = open(sys.argv[1],'rb') while True: buf = inp.read(n) if buf: m.upd

C# 计算文件的MD5值

/// <summary> /// 计算文件的MD5校验 /// </summary> /// <param name="fileName"></param> /// <returns></returns> public static string GetMd5HashFromFile(string fileName) { try { FileStream file = new FileStream(fileNam

python计算文件的md5值

前言 最近要开发一个基于python的合并文件夹/目录的程序,本来的想法是基于修改时间的比较,即判断文件有没有改变,比较两个文件的修改时间即可.这个想法在windows的pc端下测试没有问题. 但是当把一个文件从pc端复制到优盘时出现了一个问题,复制到优盘的文件比pc端的文件慢了两秒钟! 这里我用的复制函数是 shutil.copy2(),理论上它会把修改时间和最后访问时间也复制过来1,但是实际情况并不是完全相同. 详细情况我在segmentfault里提出了问题:为什么将一个文件从pc中复制到

java计算文件32位md5值

1 protected static String getFileMD5(String fileName) 2 { 3 File file = new File(fileName); 4 if(!file.exists() || !file.isFile()){ 5 return ""; 6 } 7 8 byte[] buffer = new byte[2048]; 9 try { 10 MessageDigest digest = MessageDigest.getInstance(

crypto-js计算文件的sha256值

1. 要在浏览器中计算出文件的sha256或md5值,基本思路就是使用HTML5的FileReader接口把文件读取到内存(readAsArrayBuffer),然后获取文件的二进制内容,然后获取文件的shaa256或md5值. 2. ArrayBuffer是一块内存,ArrayBuffer对象被用来表示一个通用的,固定长度的二进制数据缓冲区. 3. CryptoJS (crypto.js) 为 JavaScript 提供了各种各样的加密算法.目前已支持的算法包括: MD5 SHA-1 SHA-