安全体系（三）——SHA1算法详解

　　本文主要讲述使用SHA1算法计算信息摘要的过程。

　　为保证传输信息的安全，除了对信息加密外，还需要对信息进行认证。认证的目的有两：一是验证信息的发送者是合法的，二是验证信息的完整性。Hash函数就是进行信息认证的一种有效手段。

1.Hash函数和消息完整性

　　Hash函数也称为杂凑函数或散列函数，函数输入为一可变长度x，输出为一固定长度串，该串被称为输入x的Hash值或数字指纹。

　　因为Hash函数是多对一函数，不同的输入对应着相同的输出，求其逆是比较难，通过给定的输入计算Hash值必须是很容易，但从Hash值逆推输入则很难，因此也称Hash函数为单向Hash函数。

　　Hash函数一般满足以下几个基本需求：

　　1).输入x可以任意长度

　　2).输出数据长度固定

　　3).容易计算，给定任何x，容易计算出x的Hash值

　　4).单向函数，即给出一个Hash值，很难反向计算出原始输入的x

　　5).唯一性，即难以找出两个不同的输入会得到相同的Hash输出值

　　Hash值得长度由算法的类型决定，与输入的消息大小无关，一般为128bit或者160bit，即使两个消息的差别很小，如仅差别一两位，其Hash函数的运算结果也会截然不同，用同一个算法对某一消息进行Hash运算只能获得唯一确定的Hash值。

　　一个安全的单向迭代函数是构造安全消息Hash值得核心和基础，有了好的单向迭代函数，就可以用合适的迭代方法来构造迭代Hash函数，Hash函数的安全设计的理论主要有以下两点：一是函数的单向性，二是函数影射的随机性。常见的Hash算法有MD-5、SHA等。

2.SHA1算法简介

　　SHA(Security Hash Algorithm)是美国的NIST和NSA设计的一种标准的Hash算法，最初的版本于93年发表，称为SHA-0，因为很快就被发现存在安全隐患，于是在95年就发布第二个版本SHA-1。02年，NIST分别发布了SHA-256、SHA-384、SHA-512，这些算法统称SHA-2。08年又新增了SHA-224。目前SHA-2各版本已成为主流。

　　这里以SHA1为例来进行SHA算法的讲解，其他系列原理类似。SHA1的特性有：

　　1).不能使用消息摘要复原信息；

　　2).不同的消息产生不同的消息摘要。

3.术语和概念

3.1位(Bit)，字节（Byte）和字（Word）

　　SHA1把消息当做位（bit）字符串进行处理。最小单位称为位，8位组成一个字节，两个字节组成一个字。

　　例如，字符串“abc”转换成位字符串是01100001 01100010 01100011，转换成16进制字符串是 0x616263。

3.2 运算符和符号

　　下面的逻辑运算符作用于“字”

　　X^Y = X， Y逻辑与

　　X \/ Y = X， Y逻辑或

　　X XOR Y= X， Y逻辑异或

　　~X = X逻辑取反

　　X+Y的定义：字 X 和 Y 代表两个整数 x 和y, 其中 0 <= x < 2^32 且 0 <= y < 2^32. 令整数z = (x + y) mod 2^32. 这时候 0 <= z < 2^32. 将z转换成字Z, 那么就是 Z = X + Y.

　　循环左移位操作符Sn(X)：X是一个字，n是一个整数，0<=n<=32。Sn(X) = (X<<n)OR(X>>32-n)。这个很容易理解了，比如X=11111111 00000001 00000001 00000000，n=5，则Sn(X)=111 00000001 00000001 00000000 11111。

　　X<<n定义：抛弃最左边的n位数字，将各个位依次向左移动n位，然后用0填补右边的n位（最后结果还是32位）。

　　X>>n定义：抛弃右边的n位，将各个位依次向右移动n位，然后在左边的n位填0。

4.SHA1算法

4.1.把消息转换为位字符串

　　因为SHA1算法只接受位作为输入，所以进行计算前必须把原始消息（比如字符串、文件等）转换成位字符串。

　　比如，对字符串“abc”产生消息摘要，‘a’=97 ‘b’=98 ‘c’=99，先转换成24位的字符串：01100001 01100010 01100011

4.2.对转换得到的位字符串进行补位操作

　　消息必须进行补位，使其长度在对512取模以后的余数是448，即（补位后的消息长度）%512 = 448。

　　对消息进行补位时，先在后面补一个1，如果不满足要求，再补0直到满足对512取模余数为448。这就意味着，补位至少补一位（原消息位数为512n+447），最多补512位（原消息位数为512n+448）。

　　还是以前面的“abc”为例显示补位的过程：

　　原始信息： 01100001 01100010 01100011

　　补位第一步，首先补一个1：01100001 01100010 01100011 1

　　可以确定的是，如果用一个字节来表示一个字符，补1之后肯定不满足条件，仍需继续补位。

　　补位第二步，后面补0直到总长度对512取模余数为448，这里补423个0，使总长度达到为448：

　　01100001 01100010 01100011 1000…..00

　　补位完成后的数据转换为16进制：

　　61626380 00000000 00000000 00000000

　　00000000 00000000 00000000 00000000

　　00000000 00000000

　　从16进制数据里可以看到，我们也可以直接采用16进制的方式进行补位，我们先补80，看是否满足长度对64取余的结果为56，不满足则继续补0。

　　大家可以自己考虑一下为什么可以补80。

4.3 附加长度信息

　　这一步中，要将原始消息（没有进行补位操作之前）的长度（二进制位数）附加到已经补位的消息之后。

　　通常用一个64位的数据来表示原始消息的长度。如果消息长度不大于2^64，那么第一个字就是0。

　　补长度的操作以后，整个消息（16进制）如下：

　　61626380 00000000 00000000 00000000

　　00000000 00000000 00000000 00000000

　　00000000 00000000 00000000 00000018

　　然后，将整个消息拆分为一个一个的512位的数据块M1，M2，…,Mn，然后分别对每一个数据块Mi (1≤i≤n)做处理，得到消息摘要。

　　注意，这里是64位，上一步补位后的长度是512k+448,k≥0，这样，512k+448+64=512(k+1)，恰好可以被512整除。

　　在我们举得例子里，一共只有512位，因此做为一个数据块进行处理。

4.4 使用的常量和函数

　　一系列的常量字K(0), K(1), ... , K(79)，如果以16进制给出，它们如下：

　　K_t = 0x5A827999 (0 <= t <= 19)

　　K_t = 0x6ED9EBA1 (20 <= t <= 39)

　　K_t = 0x8F1BBCDC (40 <= t <= 59)

　　K_t = 0xCA62C1D6 (60 <= t <= 79)

　　在SHA1中我们需要一系列的函数。每个函数f_t (0 <= t <= 79)都操作32位字B，C，D并且产生32位字作为输出。f_t(B,C,D)可以如下定义

　　f_t(B,C,D) = (B AND C) OR ((NOT B) AND D) ( 0 <= t <= 19)

　　f_t(B,C,D) = B XOR C XOR D (20 <= t <= 39)

　　f_t(B,C,D) = (B AND C) OR (B AND D) OR (C AND D) (40 <= t <= 59)

　　f_t(B,C,D) = B XOR C XOR D (60 <= t <= 79)

4.5计算消息摘要

　　使用进行了补位和补长度后的消息来计算消息摘要。

计算需要的缓冲区：

　　1).两个都由5个32位的字组成缓冲区BUF1和BUF2， BUF1的5个32位缓冲区被标识为A,B,C,D,E，BUF2的5个32位缓冲区被标识为H0,H1,H2,H3,H4。

　　2).一个80个32位字的缓冲区BUF3，按照32位划分，依次被标识为W₀, W₁,..., W₇₉。

　　3).一个1个字的TEMP缓冲区。

计算消息摘要：

　　在3.2中，我们把补位之后的数据附加了长度信息，然后划分为一个一个的512位（16个字）的数据块M1,M2,…,Mn，这里会依次对每个数据块Mi (1≤i≤n)做处理。

　　在处理每个数据块Mi (1≤i≤n)之前，先将缓冲区H0,H1,H2,H3,H4 初始化为下面的值（16进制）：

　　H₀ = 0x67452301

　　H₁ = 0xEFCDAB89

　　H₂ = 0x98BADCFE

　　H₃ = 0x10325476

　　H₄ = 0xC3D2E1F0.

接下来处理 Mi(1≤i≤n)，步骤如下：

　　1). 将每个Mi 分成 16 个字（每个字32位） W₀, W₁, ... , W₁₅, W₀ 是最左边的字；

　　n个Mi就划分之后，就变成W₀,W₁,…,W₁₅,W₁₆,…,W₃₁,W₃₂,…W₇₉；

　　2). 对于 t = 16 到 79 令 W_t = S¹(W_t-3 XOR W_t-8 XOR W_{t- 14} XOR W_t-16)；

　　3). 令 A = H₀, B = H₁, C = H₂, D = H₃, E = H₄；

　　4) 对于 t = 0 到 79，执行下面的循环

　　TEMP = S⁵(A) + f_t(B,C,D) + E + W_t + K_t;

　　E = D;

　　D = C;

　　C = S³⁰(B);

　　B = A;

　　A = TEMP;

　　5). 令 H₀ = H₀ + A, H₁ = H₁ + B, H₂ = H₂ + C, H₃ = H₃ + D, H₄ = H₄ + E.

　　在处理完所有的 Mi(1≤i≤n) 后，会得到一个160位（5个32位字）的字符串消息摘要H₀ H₁ H₂ H₃ H₄。

时间： 2024-10-16 23:54:04

安全体系（三）——SHA1算法详解

1.Hash函数和消息完整性

2.SHA1算法简介

3.术语和概念

3.1位(Bit)，字节（Byte）和字（Word）

3.2 运算符和符号

4.SHA1算法

4.1.把消息转换为位字符串

4.2.对转换得到的位字符串进行补位操作

4.4 使用的常量和函数

4.5计算消息摘要

安全体系（三）——SHA1算法详解的相关文章

枚举所有子集的三种算法详解-《算法入门经典》

安全体系（一）—— DES算法详解

安全体系（二）——RSA算法详解

Dijkstra算法(三)之 Java详解

Kruskal算法(三)之 Java详解

[转] KMP算法详解

【转】AC算法详解

Manacher算法详解

Tarjan算法详解