python 模块介绍 - Base16, Base32, Base64 数据编码

简介

功能:RFC 3548: Base16, Base32, Base64 数据编码。转换二进制数据为适合明文协议传输的 ASCII 序列。转换
8bits 为每个字节包含 6,5 或 4bits 的有效数据,比如 SMTP, URL 的一部分或者 HTTP POST 的一部分。参考:
RFC 3548。编码算法不同于 uuencode。
类型:标准库
相关模块:uu, binhex, uu, quopri

Base64 是一种基于 64 个可打印字符来表示二进制数据的表示方法。由于 2 的 6 次方等于 64,所以每 6
个位元为一个单元,对应某个可打印字符。三个字节有 24 个位元,对应于 4 个 Base64 单元,即 3 个字节
需要用 4 个可打印字符来表示。它可用来作为电子邮件的传输编码。在 Base64 中的可打印字符包括字母 A-
Z、a-z、数字 0-9,这样共有 62 个字符,此外两个可打印符号在不同的系统中而不同。之后在 6 位的前面补
两个 0,形成 8 位一个字节的形式。一些如 uuencode 的其他编码方法,和之后 binhex 的版本使用不同的
64 字符集来代表 6 个二进制数字,但是它们不叫 Base64。

Base64 常用于在通常处理文本数据的场合,表示、传输、存储一些二进制数据。包括 MIME 的
email,email via MIME,在 XML 中存储复杂数据。

Python Base64 模块提供了 RFC3548 中的数据编码和解码(转换二进制数据为适合明文协议传输的
ASCII 序列,如 RFC3548 中指定。该标准定义了 Base16,Base32 和 Base64 算法,编码和解码的任意二进制字符串转换为文本字符串,这样就可以通过电子邮件安全发送,作为网址的一部分,或包含在 HTTP POST 请求中。

Base64 模块提供两个接口。新式接口支持使用三个字母的编码和解码的字符串对象。传统接口提供了编
码和解码文件对象和字符串,但只使用了标准的 Base64 字母。传统接口这里不做介绍。

base64、 base32、 base16 可以分别编码转化 8 位字节为 6 位、 5 位、 4 位。 16,32,64 分别表示用多少个字
符来编码。

更多 base64 的资料,参见
http://zh.wikipedia.org/wiki/Base64,http://tools.ietf.org/html/rfc822,http://tools.ietf.org/html/rfc14
21,http://tools.ietf.org/html/rfc2045。

快速入门

请看 python 模块介绍中的实例:

>>> import base64
>>> encoded = base64.b64encode(‘data to be encoded‘)
>>> encoded
‘ZGF0YSB0byBiZSBlbmNvZGVk‘
>>> data = base64.b64decode(encoded)
>>> data
‘data to be encoded‘

base64.b64encode(s[, altchars]):使用 Base64 编码字符串。s 是要编码的字符串。altchars 是用来替换+和/的字符串,它们在 url 和文件系统中它们有特殊含义,通常需要替换。
base64.b64decode(s[, altchars]): 解码 Base64 编码的字符串。s 为要解码的字符串。altchars 和b64encode 相同。
? base64.standard_b64encode ( s ) : 参考 b64encode。
? base64.standard_b64decode ( s ) :参考 b64decode。

Base64 编码解码

Base64 编码解码

#!/usr/bin/env python
# encoding: utf-8
#
# Copyright (c) 2008 Doug Hellmann All rights reserved.
#
"""
"""
__version__ = "$Id$"
#end_pymotw_header
import base64
import textwrap
# Load this source file and strip the header.
with open(__file__, ‘rt‘) as input:
raw = input.read()
initial_data = raw.split(‘#end_pymotw_header‘)[1]
encoded_data = base64.b64encode(initial_data)
num_initial = len(initial_data)
# There will never be more than 2 padding bytes.
padding = 3 - (num_initial % 3)
print ‘%d bytes before encoding‘ % num_initial
print ‘Expect %d padding bytes‘ % padding
print ‘%d bytes after encoding‘ % len(encoded_data)
print
print encoded_data

?执行结果

$ python base64_b64encode.py
168 bytes before encoding
Expect 3 padding bytes
224 bytes after encoding
CgppbXBvcnQgYmFzZTY0CmltcG9ydCB0ZXh0d3JhcAoKIyBMb2FkIHRoaXMgc291cmNlIGZpbGUgYW5kIHN0cmlwIHRoZSBoZWFk
ZXIuCndpdGggb3BlbihfX2ZpbGVfXywgJ3J0JykgYXMgaW5wdXQ6CiAgICByYXcgPSBpbnB1dC5yZWFkKCkKICAgIGluaXRpYWxfZGF0
YSA9IHJhdy5zcGxpdCgn

Base64 编码的 4 个字节对应实际的 3 个字节,不足四个字节时,后面部分通常用等号填充。极端的情况下,
一个字节需要用 4 个 Base64 编码来表示。

>>> import base64
>>> encoded = base64.b64encode(‘a‘)
>>> encoded
‘YQ==‘

Base64 解码参见快速入门部分介绍。

URL-Safe

?base64.urlsafe_b64encode(s):
?base64.urlsafe_b64decode(s):
Base64 默认会使用+和/, 但是这 2 个字符在 url 中也有特殊含义。使用 urlsafe 可以解决这个问题。 +替换为-,
/替换为_。

import base64
encodes_with_pluses = chr(251) + chr(239)
encodes_with_slashes = chr(255) * 2
for original in [ encodes_with_pluses, encodes_with_slashes ]:
print ‘Original
:‘, repr(original)
print ‘Standard encoding:‘, base64.standard_b64encode(original)
print ‘URL-safe encoding:‘, base64.urlsafe_b64encode(original)
print

?执行结果

$ python base64_urlsafe.py
Original
: ‘\xfb\xef‘
Standard encoding: ++8=
URL-safe encoding: --8=
Original
: ‘\xff\xff‘
Standard encoding: //8=
URL-safe encoding: __8=

其他编码

Base32 包含 26 个大写字母和 2-7 的数字。
? base64.b32encode(s):使用 Base32 编码字符串。s 是要编码的字符串。
? base64.b32decode(s[, casefold[, map01]]):解码 Base32 编码的字符串。s 为要解码的字符串 。
casefold 表示是否允许小写字母。 map01 表示允许 0 表示 0,1 表示 L 。

import base64
original_string = ‘This is the data, in the clear.‘
print ‘Original:‘, original_string
encoded_string = base64.b32encode(original_string)
print ‘Encoded :‘, encoded_string
decoded_string = base64.b32decode(encoded_string)
print ‘Decoded :‘, decoded_string

?执行结果

$ python base64_base32.py
Original: This is the data, in the clear.
Encoded : KRUGS4ZANFZSA5DIMUQGIYLUMEWCA2LOEB2GQZJAMNWGKYLSFY======
Decoded : This is the data, in the clear.

Base16 包含 16 个 16 进制大写数字。类似的有 base64.b16encode(s) ,base64.b16decode(s[,
casefold]) 。

import base64
original_string = ‘This is the data, in the clear.‘
print ‘Original:‘, original_string
encoded_string = base64.b16encode(original_string)
print ‘Encoded :‘, encoded_string
decoded_string = base64.b16decode(encoded_string)
print ‘Decoded :‘, decoded_string

?
执行结果

$ python base64_base16.py
Original: This is the data, in the clear.
Encoded : 546869732069732074686520646174612C20696E2074686520636C6561722E
Decoded : This is the data, in the clear.
Python3.4 中增加了 Ascii85 和 base85 支持 。这里暂不做详细介绍。函数如下:
? base64.a85encode(s, *, foldspaces=False, wrapcol=0, pad=False, adobe=False)
? base64.a85decode(s, *, foldspaces=False, adobe=False, ignorechars=b‘ tnrv‘)
? base64.b85encode(s, pad=False)
? base64.b85decode(b)
  • 作者博客:http://my.oschina.net/u/1433482
  • 类型:翻译加整理
  • 本文最新pdf版本下载。本文最初基于libreoffice的odt格式创建,拷贝过来格式有部分变化,建议查看原来的pdf。
  • python2 官方网址:http://docs.python.org/2/library/base64.html
  • python3 官方网址:https://docs.python.org/3/library/base64.html
  • python 标准库 pymotw:http://pymotw.com/2/base64/index.html#module-base64
时间: 2024-10-14 02:03:47

python 模块介绍 - Base16, Base32, Base64 数据编码的相关文章

python模块介绍- binascii 二进制和ASCII转换

简介 binascii模块包含很多用来方法来转换二进制和各种ASCII编码的二进制表示法.通常不直接使用这些功能,而是使用封装模块,如uu, base64或binhex.binascii模块包含用C语言编写更快的低级功能,通常为高级模块所使用. 功能:二进制和ASCII转换. 类型:标准模块 相关模块: base64 标准模块. binhex 标准模块. uu        标准模块. quopri  标准模块. Uu编码 uu编码格式现在已经比较少使用(http://zh.wikipedia.

python模块介绍

adodb:我们领导推荐的数据库连接组件bsddb3:BerkeleyDB的连接组件Cheetah-1.0:我比较喜欢这个版本的cheetahcherrypy:一个WEB frameworkctypes:用来调用动态链接库DBUtils:数据库连接池django:一个WEB frameworkdocutils:用来写文档的dpkt:数据包的解包和组包MySQLdb:连接MySQL数据库的py2exe:用来生成windows可执行文件Pylons:我们领导推荐的web frameworkpysql

python模块介绍- multi-mechanize 通用的性能测试工具

简介 Multi-Mechanize 是一个开源的性能和负载测试框架,它并发运行多个 Python 脚本对网站或者服务生成负载(组合事务).测试输出报告保存为HTML或JMeter的兼容的XML.Multi-Mechanize最常用于web性能和可扩展性(scalability)测试,也适用于任何python可以访问的API.尤其适合后台性能测试.稍微懂点编程的话,这个工具会远强过商业的性能测试工具. 主要特性: 支持各种 HTTP methods 高级超链接和HTML表单支持 支持 SSL 自

python模块介绍-webbrowser:方便的web浏览器控制器

源码:Lib/webbrowser.py 简介 webbrowser模块提供了展示基于web文档的高层接口.多数情况下, 简单地调用open() 函数即可. 在Unix的X11下,首选调用图形浏览器.如果图形浏览器不可用或者没有显示终端,则使用文本模式浏览器 .如果使用文本模式浏览器, 在用户退出浏览器之前调用进程都会阻塞. 如果设置了BROWSER环境变量,它将覆盖平台默认的浏览器列表. BROWSER是os.pathsep分割的的浏览器列表.如果列表的部分值包含字符串"%s",解析

python模块介绍- SocketServer 网络服务框架

来源:https://my.oschina.net/u/1433482/blog/190612 摘要: SocketServer简化了网络服务器的编写.它有4个类:TCPServer,UDPServer,UnixStreamServer,UnixDatagramServer.这4个类是同步进行处理的,另外通过ForkingMixIn和ThreadingMixIn类来支持异步. 创建服务器的步骤.首先,你必须创建一个请求处理类,它是BaseRequestHandler的子类并重载其handle()

python模块介绍-Tornado:Tornado中文文档-概述

快速链接 tornado-4.1.tar.gz, tornado最新版本 tornado源码@github 邮件列表:讨论.最新公告 tornado@stackoverflow tornado wiki tornado bug跟踪 快速入门 import tornado.ioloop import tornado.web class MainHandler(tornado.web.RequestHandler):     def get(self):         self.write("He

python模块介绍- google 谷歌搜索引擎python接口

简介 google 模块是谷歌搜索引擎python接口,系用urllib2在google上进行搜索,使用BeautifulSoup进行解释外部封装,非google官方接口. 功能:谷歌搜索引擎python接口 类型:外部模块 当前版本:1.0.5(查看日期2013-12-22) 下载地址: https://pypi.python.org/pypi/google 月下载量:1万左右 平台:跨平台 安装 从https://pypi.python.org/pypi/setuptools下载最新版本的s

python模块介绍-requests:人性化的HTTP

目录 人性化的HTTP Requests 是使用 Apache2 Licensed 许可证的 HTTP 库.用 Python 编写,真正的为人类着想. Python 标准库中的 urllib2 模块提供了你所需要的大多数 HTTP 功能,但是它的 API 太渣了.它是为另一个时代.另一个互联网所创建的.它需要巨量的工作,甚至包括各种方法覆盖,来完成最简单的任务. 在Python的世界里,事情不应该这么麻烦. 线程对象 最简单的方法:使用target指定线程要执行的目标函数,再使用start()启

python模块介绍- collections(5)-OrderedDict 有序字典

1.3.5 OrderedDict 有序字典 OrderedDict是dict的子类,它记住了内容添加的顺序. import collections print 'Regular dictionary:' d = {} d['a'] = 'A' d['b'] = 'B' d['c'] = 'C' for k, v in d.items(): print k, v print '\nOrderedDict:' d = collections.OrderedDict() d['a'] = 'A' d