python模块介绍- binascii 二进制和ASCII转换

简介

binascii模块包含很多用来方法来转换二进制和各种ASCII编码的二进制表示法。通常不直接使用这些功能,而是使用封装模块,如uu, base64或binhex。binascii模块包含用C语言编写更快的低级功能,通常为高级模块所使用。

  • 功能:二进制和ASCII转换。
  • 类型:标准模块
  • 相关模块:
    1. base64 标准模块。
    2. binhex 标准模块。
    3. uu        标准模块。
    4. quopri  标准模块。

Uu编码

uu编码格式现在已经比较少使用(http://zh.wikipedia.org/wiki/Uuencode),相关函数binascii.a2b_uu(string)和binascii.b2a_uu(data)这里不做介绍。 更多资料参见:http://docs.python.org/2/library/uu.html

Binhex编码

Binhex用于Macintosh平台。这里暂不做介绍。相关函数有:binascii.rledecode_hqx(data) ,binascii.rlecode_hqx(data),binascii.b2a_hqx(data) ,binascii.crc_hqx(data, crc)。 更多资料参见: http://docs.python.org/2/library/uu.html

Base64编码

binascii.a2b_base64(string):转换的base64数据块为二进制,并返回二进制数据。一次可以传递多行。和base64. b64decode对应。 binascii.b2a_base64(data):转换二进制数据为一行base64编码的ASCII字符。返回字符串包含换行符。根据base64的标准data的长度最大为57。和base64. b64encode对应。 更多资料参见:http://docs.python.org/2/library/base64.html

QP码

Quoted-printable,或QP encoding,没有规范的中文译名,可译为“可打印字符引用编码”、“使用可打印字符的编码”。Quoted-printable是使用可打印的 ASCII字符 (如字母、数字与"=")表示各种编码格式下的字符,以便能在7-bit数据通路上传输8-bit数据, 或者更一般地说在非8-bit clean媒体上正确处理数据。这被定义为MIME content transfer encoding,用于e-mail。

QP使用"="开头的转义字符. 一般限制行宽为76,因为有些软件限制了行宽.

binascii.a2b_qp(string[, header]):转换引述打印数据块为二进制,并返回二进制数据。多行可以在同一时间被传递。如果可选参数头存在和真实,下划线将被解码为空格。

实际上,QP码是是把’\x00’转换成’=00’,也就是替换’\x’为’=’。

>>> s =‘\x00=‘
>>> s = ‘=\x00hello‘
>>> import binascii
>>> encoded = binascii.b2a_qp(s)
>>> encoded
‘=3D=00hello‘
>>> decoded = binascii.a2b_qp(encoded)
>>> print decoded
=hello
>>> print repr(decoded)
‘=\x00hello‘

CRC校验和

binascii.crc32(data[, crc]):计算的data 的32位校验和CRC- 32时,crc为初始CRC 。crc32与ZIP文件的校验和一致。

>>> print binascii.crc32("hello world")
222957957
>>> crc = binascii.crc32("hello")
>>> crc = binascii.crc32(" world", crc) & 0xffffffff
>>> print ‘crc32 = 0x%08x‘ % crc
crc32 = 0x0d4a1185
>>> crc
222957957

为了保证跨平台,可以在crc结果上& 0xffffffff。原因如下:

Changed in version 2.6: The return value is in the range [-2**31, 2**31-1] regardless of platform. In the past the value would be signed on some platforms and unsigned on others. Use & 0xffffffff on the value if you want it to match Python 3 behavior.
Changed in version 3.0: The return value is unsigned and in the range [0, 2**32-1] regardless of platform.

二进制转换

binascii.b2a_hex(data)和binascii.hexlify(data):返回二进制数据的十六进制表示。每个字节被转换成相应的 2位十六进制表示形式。因此,得到的字符串是是原数据长度的两倍。 binascii.a2b_hex(hexstr) 和binascii.unhexlify(hexstr):从十六进制字符串hexstr返回二进制数据。是b2a_hex的逆向操作。 hexstr必须包含偶数个十六进制数字(可以是大写或小写),否则报TypeError。

>>> s = ‘hello‘
>>> b = b2a_hex(s)
>>> print b
68656c6c6f
>>> a2b_hex(b)
‘hello‘
>>> b = hexlify(s)
>>> print b
68656c6c6f
>>> unhexlify(b)
‘hello‘

其他实例

http://effbot.org/librarybook/binascii.htm有如下实例:

import binasciitext = "hello, mrs teal"data = binascii.b2a_base64(text)text = binascii.a2b_base64(data)print text, "<=>", repr(data)data = binascii.b2a_uu(text)text = binascii.a2b_uu(data)print text, "<=>", repr(data)data = binascii.b2a_hqx(text)text = binascii.a2b_hqx(data)[0]print text, "<=>", repr(data)# 2.0 and newerdata = binascii.b2a_hex(text)text = binascii.a2b_hex(data)print text, "<=>", repr(data)

执行结果:

# python test.py 
hello, mrs teal <=> ‘aGVsbG8sIG1ycyB0ZWFs\n‘
hello, mrs teal <=> ‘/:&5L;&\\L(&UR<R!T96%L\n‘
hello, mrs teal <=> ‘D\‘9XE\‘mX)\‘ebFb"[email protected]&X‘
hello, mrs teal <=> ‘68656c6c6f2c206d7273207465616c‘

另外单元测试的代码也可供参考:http://svn.python.org/projects/python/branches/tarek_sysconfig/Lib/test/test_binascii.py

参考资料

时间: 2024-11-05 19:41:16

python模块介绍- binascii 二进制和ASCII转换的相关文章

python 模块介绍 - Base16, Base32, Base64 数据编码

简介 功能:RFC 3548: Base16, Base32, Base64 数据编码.转换二进制数据为适合明文协议传输的 ASCII 序列.转换8bits 为每个字节包含 6,5 或 4bits 的有效数据,比如 SMTP, URL 的一部分或者 HTTP POST 的一部分.参考:RFC 3548.编码算法不同于 uuencode.类型:标准库相关模块:uu, binhex, uu, quopri Base64 是一种基于 64 个可打印字符来表示二进制数据的表示方法.由于 2 的 6 次方

python模块介绍

adodb:我们领导推荐的数据库连接组件bsddb3:BerkeleyDB的连接组件Cheetah-1.0:我比较喜欢这个版本的cheetahcherrypy:一个WEB frameworkctypes:用来调用动态链接库DBUtils:数据库连接池django:一个WEB frameworkdocutils:用来写文档的dpkt:数据包的解包和组包MySQLdb:连接MySQL数据库的py2exe:用来生成windows可执行文件Pylons:我们领导推荐的web frameworkpysql

python模块介绍- multi-mechanize 通用的性能测试工具

简介 Multi-Mechanize 是一个开源的性能和负载测试框架,它并发运行多个 Python 脚本对网站或者服务生成负载(组合事务).测试输出报告保存为HTML或JMeter的兼容的XML.Multi-Mechanize最常用于web性能和可扩展性(scalability)测试,也适用于任何python可以访问的API.尤其适合后台性能测试.稍微懂点编程的话,这个工具会远强过商业的性能测试工具. 主要特性: 支持各种 HTTP methods 高级超链接和HTML表单支持 支持 SSL 自

python模块介绍-webbrowser:方便的web浏览器控制器

源码:Lib/webbrowser.py 简介 webbrowser模块提供了展示基于web文档的高层接口.多数情况下, 简单地调用open() 函数即可. 在Unix的X11下,首选调用图形浏览器.如果图形浏览器不可用或者没有显示终端,则使用文本模式浏览器 .如果使用文本模式浏览器, 在用户退出浏览器之前调用进程都会阻塞. 如果设置了BROWSER环境变量,它将覆盖平台默认的浏览器列表. BROWSER是os.pathsep分割的的浏览器列表.如果列表的部分值包含字符串"%s",解析

python模块介绍- SocketServer 网络服务框架

来源:https://my.oschina.net/u/1433482/blog/190612 摘要: SocketServer简化了网络服务器的编写.它有4个类:TCPServer,UDPServer,UnixStreamServer,UnixDatagramServer.这4个类是同步进行处理的,另外通过ForkingMixIn和ThreadingMixIn类来支持异步. 创建服务器的步骤.首先,你必须创建一个请求处理类,它是BaseRequestHandler的子类并重载其handle()

python模块介绍-Tornado:Tornado中文文档-概述

快速链接 tornado-4.1.tar.gz, tornado最新版本 tornado源码@github 邮件列表:讨论.最新公告 tornado@stackoverflow tornado wiki tornado bug跟踪 快速入门 import tornado.ioloop import tornado.web class MainHandler(tornado.web.RequestHandler):     def get(self):         self.write("He

python模块介绍- google 谷歌搜索引擎python接口

简介 google 模块是谷歌搜索引擎python接口,系用urllib2在google上进行搜索,使用BeautifulSoup进行解释外部封装,非google官方接口. 功能:谷歌搜索引擎python接口 类型:外部模块 当前版本:1.0.5(查看日期2013-12-22) 下载地址: https://pypi.python.org/pypi/google 月下载量:1万左右 平台:跨平台 安装 从https://pypi.python.org/pypi/setuptools下载最新版本的s

python模块介绍-requests:人性化的HTTP

目录 人性化的HTTP Requests 是使用 Apache2 Licensed 许可证的 HTTP 库.用 Python 编写,真正的为人类着想. Python 标准库中的 urllib2 模块提供了你所需要的大多数 HTTP 功能,但是它的 API 太渣了.它是为另一个时代.另一个互联网所创建的.它需要巨量的工作,甚至包括各种方法覆盖,来完成最简单的任务. 在Python的世界里,事情不应该这么麻烦. 线程对象 最简单的方法:使用target指定线程要执行的目标函数,再使用start()启

python模块介绍- collections(5)-OrderedDict 有序字典

1.3.5 OrderedDict 有序字典 OrderedDict是dict的子类,它记住了内容添加的顺序. import collections print 'Regular dictionary:' d = {} d['a'] = 'A' d['b'] = 'B' d['c'] = 'C' for k, v in d.items(): print k, v print '\nOrderedDict:' d = collections.OrderedDict() d['a'] = 'A' d