[C语言]Base64编码解码

Base64编码解码

一,Base64编码原理

Base64编码的字符数组如下所示 :

ABCDEFGHIJKLMNOPQRSTUVWXYZabcdefghijklmnopqrstuvwxyz0123456789+/

字符串转Base64编码:取3字节的字符串转换为四字节的字符串,依次往后转换。得到Base64编码字符串。具体原理如下:

1,如果需要编码的原串字节数刚好为3的倍数,那么转换规则如下:

以中文字符‘严‘为例,‘严‘字的UTF-8编码为:0xE4B8A5 = 11100100  10111000  10101001。即有:

1)UTF-8第一个字节:0xE4 = 11100100

2)UTF-8第二个字节:0xB8 = 10111000

3)UTF-8第三个字节:0xA5 = 10101001

转Base64的过程如下:

1)Base64第一个字节:取UTF-8第一字节的前六位(111001),然后在六位字符前(111001)填充00,既得Base64编码的第一个字节(00111001)。

2)Base64第二个字节:取UTF-8第一字节的最后两位(00),再取UTF-8第二字节的前四位(1011)组成六位字符串001011,然后在组成的六位字符串(001011)前面填充00,既得Base64编码的第二个字节(00001011)

3)Base64第三个字节:取UTF-8第二字节的后四位(1000),再取UTF-8第三字节的前两位(10)组成六位字符串100010,然后在组成的六位字符串(100010)前面填充00,既得Base64编码的第三个字节(00100010)

4)Base64第四个字节:取UTF-8第三字节的后六位(101001),然后在六位字符前(101001)填充00,既得Base64编码的第四个字节(00101001)。

2,如果需要编码的原串字节数最后剩余2,那么转换规则如下:

以字符串"aa"为例,"aa"的UTF-8编码为:0x6161  =  01100001  01100001。既有:

1)UTF-8第一个字节:0x61 = 01100001

2)UTF-8第二个字节:0x61  =  01100001

转Base64的过程如下:

1)Base64第一个字节:取UTF-8第一字节的前六位(011000),然后在六位字符前(011000)填充00,既得Base64编码的第一个字节(00011000)。

2)Base64第二个字节:取UTF-8第一字节的最后两位(01),再取UTF-8第二字节的前四位(0110)组成六位字符串010110,然后在组成的六位字符串(010110)前面填充00,既得Base64编码的第二个字节(00010110)。

3)Base64第三个字节:取UTF-8第二字节的后四位(0001),然后在四位字符(0001)前填充00,得六位字符串(000001),由于此时不够一个字节(八位),再在六位字符串(000001)后面填充00即可,既得Base64编码的第三个字节(00000100)。

4)Base64第四个字节:此时使用字符‘=‘填充即可。

3,如果需要编码的原串字节数最后剩余1,那么转换规则如下:

以字符串"a"为例,"a"的UTF-8编码为:0x61  =  01100001。既有:

1)UTF-8第一个字节:0x61  = 01100001

转Base64的过程如下:

1)Base64第一个字节:取UTF-8第一字节的前六位(011000),然后在六位字符前(011000)填充00,既得Base64编码的第一个字节(00011000)。

2)Base64第二个字节:取UTF-8第一字节的最后两位(01),然后在两位字符(01)前填充00,得四位字符串(0001),由于此时不够一个字节(八位),再在四位字符串(0001)后面填充0000即可,既得Base64编码的第二个字节(00010000)。

3)Base64第三个字节:此时使用字符‘=‘填充即可。

3)Base64第四个字节:此时使用字符‘=‘填充即可。

综上可得编码程序如下:

int
base64_string( const unsigned char *src, unsigned char *dest, unsigned char *base64, int index )
{
    assert( src );

    unsigned char one;
    unsigned char two;
    unsigned char thr;
    unsigned char fou;

    size_t len = strlen( src );
    if ( len >= 3 )
    {
        one = src[0] >> 2;
        two = ( ( src[0] & 0x03 ) << 4 ) | ( src[1] >> 4 );
        thr = ( ( src[1] & 0x0F ) << 2 ) | ( src[2] >> 6 );
        fou = src[2] & 0x3F;

        *( dest + index++ ) = base64[one];
        *( dest + index++ ) = base64[two];
        *( dest + index++ ) = base64[thr];
        *( dest + index   ) = base64[fou];
    }
    else if ( len == 2 )
    {
        one = src[0] >> 2;
        two = ( ( src[0] & 0x03) << 4 ) | ( src[1] >> 4 );
        thr = ( src[1] & 0x0F ) << 2;

        *( dest + index++ ) = base64[one];
        *( dest + index++ ) = base64[two];
        *( dest + index++ ) = base64[thr];
        *( dest + index   ) = ‘=‘;
    }
    else if ( len == 1 )
    {
        one = src[0] >> 2;
        two = ( src[0] & 0x03 ) << 4;

        *( dest + index++ ) = base64[one];
        *( dest + index++ ) = base64[two];
        *( dest + index++ ) = ‘=‘;
        *( dest + index   ) = ‘=‘;
    }
    else
    {
        printf( "Unknow length\n" );
    }

    return len >= 3 ? 3 : len;
}

void
base64_encode( const unsigned char *src, unsigned char *dest )
{
    assert( src );

    unsigned char base64[] = "ABCDEFGHIJKLMNOPQRSTUVWXYZabcdefghijklmnopqrstuvwxyz0123456789+/";
    int index = 0;
    while ( *src )
    {
        int step = base64_string( src, dest, base64, index );

        index += 4;
        src   += step;
    }

    *( dest + index ) = ‘\0‘;
}

二,Base64解码

1,原理

Base64字符串以四字节为一组,转换为三字节的过程。依次类推,直到全部转化完成。

2,数组

由于Base64编码时用到如下所示的字符数组进行转换,字符数组如下:

ABCDEFGHIJKLMNOPQRSTUVWXYZabcdefghijklmnopqrstuvwxyz0123456789+/

由上可知,A在数组的位置为0,故有(A,0),依次类推有(B,1),(C,2)等。故可得如下所示的对应关系:

A  B  C  D  E  F  G  H  I  J
0  1  2  3  4  5  6  7  8  9

K  L  M  N  O  P  Q  R  S  T 
10 11 12 13 14 15 16 17 18 19

U  V  W  X  Y  Z  a  b  c  d
20 21 22 23 24 25 26 27 28 29

e  f  g  h  i  j  k  l  m  n
30 31 32 33 34 35 36 37 38 39

o  p  q  r  s  t  u  v  w  x
40 41 42 43 44 45 46 47 48 49

y  z  0  1  2  3  4  5  6  7
50 51 52 53 54 55 56 57 58 59

8  9  +  /
60 61 62 63

由于编码时,如果得到的一个字节的值为0那么编码后即为A。相应的,在解码过程中,如果一个字节的值为A,那么转换为0即可。由于A的十进制值为65,而在编码数组的下标为0。既有A-65-0。同理,B的十进制值为66,在编码数组的下标为1,既有B-66-1。

Base64字符所在的区间为A-Z,a-z,0-9,+,/。由上可知,其中的临界值有如下对应关系:

base64字符 - 字符值(解码数组的下标) - 在base64编码数组中的下标

A  -  65  -  0

Z  -  90  -  25

a  -  97  -  26

z  - 122 -  51

0  -  48  -  52

9  -  57  -  61

+  -  43  -  62

/   -  47  -  63

一个字节八位,故最大值为2^8 = 256,但由上临界值可知最大值为122,所以实际解码数组定义为124长度即可(0-122存关键信息,123存‘\0‘)。故可得如下数组:

0x00, 0x00, 0x00, 0x00, 0x00, 0x00, 0x00, 0x00, 0x00, 0x00, 0x00, 0x00, 0x00, 0x00, 0x00, 0x00, 
0x00, 0x00, 0x00, 0x00, 0x00, 0x00, 0x00, 0x00, 0x00, 0x00, 0x00, 0x00, 0x00, 0x00, 0x00, 0x00, 
0x00, 0x00, 0x00, 0x00, 0x00, 0x00, 0x00, 0x00, 0x00, 0x00, 0x00, 0x3E, 0x00, 0x00, 0x00, 0x3F, 
0x34, 0x35, 0x36, 0x37, 0x38, 0x39, 0x3A, 0x3B, 0x3C, 0x3D, 0x00, 0x00, 0x00, 0x00, 0x00, 0x00, 
0x00, 0x00, 0x01, 0x02, 0x03, 0x04, 0x05, 0x06, 0x07, 0x08, 0x09, 0x0A, 0x0B, 0x0C, 0x0D, 0x0E, 
0x0F, 0x10, 0x11, 0x12, 0x13, 0x14, 0x15, 0x16, 0x17, 0x18, 0x19, 0x00, 0x00, 0x00, 0x00, 0x00, 
0x00, 0x1A, 0x1B, 0x1C, 0x1D, 0x1E, 0x1F, 0x20, 0x21, 0x22, 0x23, 0x24, 0x25, 0x26, 0x27, 0x28, 
0x29, 0x2A, 0x2B, 0x2C, 0x2D, 0x2E, 0x2F, 0x30, 0x31, 0x32, 0x33,

获取数组的程序如下所示:

void
create_array( unsigned char *array )
{
    int index  = 0;
    for ( index  = 0; index < 123; index += 1 )
    {
        if ( index == 0x2B )
        {
            *( array + index ) = 0x3E;
        }
        else if ( index == 0x2F )
        {
            *( array + index ) = 0x3F;
        }
        else if ( index >= 0x30 && index <= 0x39 )
        {
            *( array + index ) = 0x34 + index - 0x30;
        }
        else if ( index == 0x3D )
        {
             /* 特殊字符‘=‘,也可合并到else情况 */
            *( array + index ) = 0x00;
        }
        else if ( index >= 0x41 && index <= 0x5A )
        {
            *( array + index ) = index - 0x41;
        }
        else if ( index >= 0x61 && index <= 0x7A )
            *( array + index ) = 0x1A + index - 0x61;
        }
        else
        {
            *( array + index ) = 0x00;
        }
    }

    *( array + 123 ) = ‘\0‘;
}

3,解码

解码时分三种情况处理:

1)四个字符中最后一个字符为‘=‘的情况,以YWE=为例:

首先将除‘=‘外的字节转换为对应的二进制:

Base64第一个字节:Y :24 = 0001 1000(24是Y对应数组下标的值)

Base64第二个字节:W:22 = 0001 0110

Base64第三个字节:E :4   = 0000 0100

取Base64的第一字节后六位(011000)和Base64第二字节去掉前两位填充位00后(010110)的前两位(01),拼接后既得UTF-8编码的第一个字节(01100001)

取Base64的第二字节后四位(0110)和Base64第三字节去掉前两位填充位00后(000100),再去掉后两位填充位00后(0001),拼接后既得UTF-8编码的第二个字节(01100001)

2)四个字符中最后两个字符为‘=‘的情况,以YQ==为例:

首先将除‘=‘外的字节转换为对应的二进制:

Base64第一个字节:Y :24 = 0001 1000

Base64第二个字节:Q :16 = 0001 0000

取Base64的第一个字节后六位(011000)和Base64第二字节去掉前两位填充位00后(010000),再去掉后四位填充位0000后(01),拼接后即可得UTF-8编码的第一个字节(01100001)

3)四个字符中不包含字符‘=‘的情况,以5Lil为例:

首先将除‘=‘外的字节转换为对应的二进制:

Base64第一个字节:5:57 = 0011 1001

Base64第二个字节:L:11 = 0000 1011

Base64第三个字节:i:34  = 0010 0010

Base64第四个字节:l:37  = 0010 0101

取Base64第一个字节后六位(111001)和Base64第二字节去掉前两位填充位00后的前两位(00),拼接后既得UTF-8编码的第一个字节(11100100)

取Base64第二字节的后四位(1011)和Base64第三字节去掉前两位填充位00后的前四位(1000),拼接后既得UTF-8编码的第二字节(10111000)

取Base64第三字节的后两位(10)和Base64第四字节的后六位(100101),拼接后既得UTF-8编码的第三字节(10100101)

综上可知,解码程序如下:

int
decode_string( const unsigned char *src, unsigned char *dest, unsigned char *array, int index )
{
    assert( src );

    int step = 0;

    unsigned char one;
    unsigned char two;
    unsigned char thr;
    if ( src[3] == ‘=‘ && src[2] == ‘=‘ )
    {
        one = ( array[src[0]] << 2 ) | ( array[src[1]] >> 4 );
        *( dest + index ) = one;

        step = 1;
    }
    else if ( src[3] == ‘=‘ )
    {
        one = ( array[src[0]] << 2 ) | ( array[src[1]] >> 4 );
        two = ( ( array[src[1]] & 0x0F ) << 4 ) | ( array[src[2]] >> 2 );

        *( dest + index++ ) = one;
        *( dest + index   ) = two;

        step = 2;
    }
    else
    {
        one = ( array[src[0]] << 2 ) | ( array[src[1]] >> 4 );
        two = ( ( array[src[1]] & 0x0F ) << 4 ) | ( array[src[2]] >> 2 );
        thr = ( array[src[2]] << 6 ) | array[src[3]];

        *( dest + index++ ) = one;
        *( dest + index++ ) = two;
        *( dest + index   ) = thr;

        step = 3;
    }

    return step;
}

void
base64_decode( const unsigned char *src, unsigned char *dest )
{
    assert( src );

    unsigned char array[124];
    memset( array, 0x00, 124 );
    create_array( array );

    int index = 0;
    while ( *src )
    {
        int step = decode_string( src, dest, array, index );

        index += step;
        src   += 4;
    }

    *( dest + index ) = ‘\0‘;
}

参考文献:http://blog.itpub.net/18903360/viewspace-1985669/

时间: 2024-10-01 06:25:18

[C语言]Base64编码解码的相关文章

go语言 base64编码解码

package main import ( "encoding/base64" "fmt" ) func main() { str := "Man" fmt.Println("原字符串是:", str) enStr := Base64EncodeString(str) fmt.Println("编码后字符串是:", enStr) deStrBytes, deStr := Base64DecodeString

Base64编码解码算法

Base64不是什么新奇的算法了,不过如果你没从事过页面开发(或者说动态页面开发,尤其是邮箱服务),你都不怎么了解过,只是听起来很熟悉. 对于黑客来说,Base64与MD5算法有着同样的位置,因为电子邮箱(e-mail)正文就是base64编码的. 那么,我们就一起来深入的探讨一下这个东东吧. 对于一种算法,与其问"它是什么?",不如问"它实现了什么?" Base64实现了:将任意字节转为可读字符的编码. 我们知道,除了页面上的文本,计算机中的数据还有很多是不可见的

Atitit.&#160;二进制数据ascii表示法,与base64编码解码api&#160;设计标准化总结java&#160;php&#160;c#.net

Atitit. 二进制数据ascii表示法,与base64编码解码api 设计标准化总结java php c#.net 1. Base64编码,1 1.1. 子模式 urlsafe Or  url unsafe2 1.2. 其他的二进制数据表示法  bin2hex() ,Quoted-printable ,UUencode2 2. Base64常用api2 2.1. ------------解码api2 2.2. decode(String s, OutputStream out)2 2.3. 

OpenSSL 使用 base64 编码/解码(liang19890820)

关于 OpenSSL 的介绍及安装请参见:Windows 下编译 OpenSSL 下面主要介绍有关 OpenSSL 使用 base64 编码/解码. 简述 编码解码 更多参考 编码/解码 #include <openssl/evp.h> #include <openssl/bio.h> #include <openssl/buffer.h> #include <string> #include <iostream> using namespace

java对文件的二进制流base64编码解码

1.java对文件的二进制流base64编码解码 一般保存文件的时候选择的方式是将url存进数据库.今天遇到一个对接传文件流的二进制base64编码,简单记录一下. 依赖于commons-io包和commons-codec包. 编码的方法如下: public static String encodeFile(File file) throws IOException { byte[] readFileToByteArray = FileUtils.readFileToByteArray(file

Base64编码解码原理

一.编码规则 Base64编码的思想是是采用64个基本的ASCII码字符对数据进行重新编码.它将需要编码的数据拆分成字节 数组.以3个字节为一组.按顺序排列24 位数据,再把这24位数据分成4组,即每组6位.再在每组的的最高位前 补两个0凑足一个字节.这样就把一个3字节为一组的数据重新编码成了4个字节.当所要编码的数据的字节数不是 3的整倍数,也就是说在分组时最后一组不够3个字节.这时在最后一组填充1到2个0字节.并在最后编码完成后在 结尾添加1到2个 "=". 例:将对ABC进行BA

Android Base64编码解码

服务端图片的信息被转化成字符串,传到android客户端,android端需要把这些信息再解码转化成图片并保存在本地. //编码部分 String string = Base64.encodeToString(str.getBytes(),Base64.DEFAULT); //解码部分string 是服务端发来的信息 byte[] byteIcon= Base64.decode(string,Base64.DEFAULT); for (int i = 0; i < byteIcon.length

Javascript中Base64编码解码的使用实例

Javascript为我们提供了一个简单的方法来实现字符串的Base64编码和解码,分别是window.btoa()函数和window.atob()函数. 例如: 1 2 var encodedStr = window.btoa("Hello world"); //字符串编码 var decodedStr = window.atob(encodedStr); //字符串解码

C# base64 编码 解码

编码: byte[] bytes=Encoding.Default.GetBytes("要转换的字符串"); Convert.ToBase64String(bytes); 解码: //"ztKwrsTj"是"我爱你"的base64编码 byte[] outputb = Convert.FromBase64String("ztKwrsTj");    string orgStr= Encoding.Default.GetStri