QP(Quote-Printable) 编码

QP(Quote-Printable)   方法,通常缩写为“Q”方法,其原理是把一个
8   bit   的字符用两个16进制数值表示,然后在前面加“=”。所以我们看到经过QP编码
后的文件通常是这个样子:=B3=C2=BF=A1=C7=E5=A3=AC=C4=FA=BA=C3=A3=A1。
Quoted-Printable   加码规则(RFC   1341):

1.   字符用   =XX   形式表示,其中   XX   是该字符的十六进制值,
必须为   0-9   或者   A-F   (使用大写字符),除非有可替换说明,
否则,此原则是强制性的。

2.   其中,十进制值   33-60   &   62-126(注意:   即不包含   ‘= ‘   )  
可以作为标准   ASCII   从而不进行转换。

3.   另外,十进制值   9-32   也可以作为制表和格式控制字符,
从而不进行转换。(注意,这个不是必须执行的,即也可以转换)

4.   由于在   RFC822   协议中规定主体   body   文本中各行均有最大字
符限制,因此,当主体文本中出现   CRLF(carriage return/line feed)或者   LFCR   字符序列,
或者单独的   CR   以及   LF   字符的时候,必须转换成对应的  
"=0D=0A ", "=0A=0D ", "=0D ", "=0A "   等编码来表示。

5.   (关于软回车的问题)   Quoted-Printable   编码要求编码后每行
最大字符数量不得超过   76   个字符。如果对大于该字符数量的行进
行编码,则必须使用软回车。所以,对于某个以编码行的最后加上
‘= ‘符号,则表示最后这个   ‘= ‘   是一个无意义的软回车。所以,如
果一个尚未编码的行的内容如下的话:

Now ‘s   the   time   for   all   folk   to   come   to   the   aid   of   their   country.

那么在   Quoted-Printable   中可以表示为:

Now ‘s   the   time   =
for   all   folk   to   come=
  to   the   aid   of   their   country.

他提供了一种对过长的行进行编码并恢复到用户原来的输入内容的
机制。虽然一行的末尾的   CRLF   不计入   76   个字符的限制之中,但
是所有的其他字符,包括   ‘= ‘   符号都将被计算在内。

由于连字符号   ‘- ‘   在   Quoted-Printable   编码中表示他自己,所以当
我们在对一个   multipart   实体的主体内容编码的时候,我们必须注
意:我们决不能让一个   boundary   标志符出现在编码的主体部分!
(一个比较好的办法是在   boundary   中包含一个 "=_ ",这样就决不会重复
了,具体情况清查阅   RFC   1341   中的   multipart   message   的定义部分。)

注意:采用   Quoted-Printable   编码是邮件的传输过程中,对于易读性
和可靠性折衷的一种编码。对于使用   Quoted-Printable   编码的邮件主
体,绝大多数邮件网关(mail   gateway)都能够可靠的工作,但是也可能
在极少的邮件网关上工作的并不十分好,最显著的莫过于涉及到那些
EBCDIC   的传输的时候。(理论上来说,   EBCDIC   网关能够对   Quoted-Pintable
编码进行解码,然后使用   Base64   编码来重新对主体内容进行编码,但是
这些网关在实际中还没有出现呢。)
对于更高的要求,我们使用   Base64   编码。一种适度可信的传输通过
EBCDIC   网关的方法就是依照   [规则   1]   引用如下的   ASCII   码:

! "#[email protected][\]^`{|}~

更多信息请查看   RFC1341   的   [附录   B]。

由于被   Quoted-Printable   编码的数据通常被认为是行导向的(line-oriented),
对于使用   Quoted-Printable   编码的数据我们希望行与行之间换行符在传输中被
改写(译者注:由于不同的系统   unix,   windows,   mac得换行符不同),同样的,我
们希望一封普通文本文件内容的邮件(plain   text   mail)可以在不同的系统中转换
成不同换行符的互联网邮件(Internet   mail)。如果这种转换可能导致原始数据大
量变化(a   corruption   of   the   data),那么比较明智的选择是应用   base64   编码,
来替换   Quoted-Printable   编码!
引:http://topic.csdn.net/t/20031008/20/2334682.html

时间: 2024-12-28 16:27:18

QP(Quote-Printable) 编码的相关文章

urllib.quote解码编码

urllib.quote('编码坑爹'.decode('gbk').encode('utf-8')) 中文解码decode('gbk')国际编码 encode('utf-8') 原文地址:https://www.cnblogs.com/qmjy/p/11408383.html

Linux工具开发[02]---编程实现对输入字符序列变换(编码/加密/散列)方式的智能判定

怎样简单实现一个能够智能判定输入字符序列变换方式的小程序 本文由CSDN-蚍蜉撼青松 [主页:http://blog.csdn.net/howeverpf]原创,转载请注明出处! 问题描写叙述: 在分析网络数据包或者研究安全问题时.经常会遇到变换后的字符序列.而是否能准确识别密文的变换算法,对进一步的分析工作非常关键. 经常使用的变换算法包含但不限于:Base64.URL编码.HTML编码.MD5散列.DES加密.RSA加密等. 要求: 1)在理解算法原理及密文特点的基础上.使用随意编程语言实现

Linux工具开发---2编程实现对输入字符序列变换(编码/加密/散列)方式的智能判定

如何简单实现一个可以智能判定输入字符序列变换方式的小程序 本文由CSDN-蚍蜉撼青松 [主页:http://blog.csdn.net/howeverpf]原创,转载请注明出处! 问题描述: 在分析网络数据包或者研究安全问题时,经常会遇到变换后的字符序列.而能否准确识别密文的变换算法,对进一步的分析工作很关键.常用的变换算法包括但不限于:Base64.URL编码.HTML编码.MD5散列.DES加密.RSA加密等.要求: 1)在理解算法原理及密文特点的基础上,使用任意编程语言实现,当输入一段密文

day8_编码和解码

from urllib.parse import quote # url编码用的 from urllib.parse import unquote # url解码用的 a = '圣诞%sfd' print(quote(a)) # 会打印出    %E5%9C%A3%E8%AF%9E%25sfd这种编码 b = '%E5%9C%A3%E8%AF%9E%25sfd' print(unquote(b)) # 会解码生成原来的     圣诞%sfd 原文地址:https://www.cnblogs.co

Python(17)_urllib下的parse的编码解码函数

import urllib.parse url = 'https://www.baidu.com/s?wd=董博文&ie=utf-8&tn=97931839_hao_pg' ''' quote url编码函数''' ret =urllib.parse.quote(url) print(ret) '''url 解码函数''' ret = urllib.parse.unquote(ret) print(ret) 原文地址:https://www.cnblogs.com/sunnybowen/p

python 爬虫抓取心得

quanwei9958 转自 python 爬虫抓取心得分享 urllib.quote('要编码的字符串') 如果你要在url请求里面放入中文,对相应的中文进行编码的话,可以用: urllib.quote('要编码的字符串') query = urllib.quote(singername) url = 'http://music.baidu.com/search?key='+query response = urllib.urlopen(url) text = response.read()

python 抓取搜狗微信出现的问题,求大神解决

爬取到的data不是想要获取文章页面的源码,而是跳转到验证码的页面的源码.我网上查了一下是由于访问过于频繁导致的,我也加了time.sleep和改了请求头但还是显示不了,求大神支招,除了识别验证码的方式还能怎么做?? import re import urllib.request import time import urllib.error headers = {'User-Agent','Mozilla/5.0 (Windows NT 6.1; WOW64; rv:23.0) Gecko/2

X264码率控制总结2

X264码率控制方法定性概述 x264/doc/ratecontrol.txt A qualitative overview of x264's ratecontrol methods By Loren Merritt 历史笔记: 本文件是过时的,但相当一部分叙述仍然是准确的,以下是一些重要的码率控制算法更新: 1. 默认情况下,MB-tree代替了qcomp用以计算各帧的复杂度,MB-tree是qcomp在宏块级的有效推广.MB-tree还替代了B帧QP固定偏移. 2. 现在自适应量化(Ada

HEVC码率控制简介(R-lamda)

HEVC码率控制介绍 R-lamda模型提出到优化已有2年,从近几年的文章来看,大体归为类:一是帧内的码率的码率控制算法,一是模型参数更新,一是考虑感知 第一类:K0103码率控制算法主要是在P/B帧上提出的,I帧没有做,体现在I帧中LCU编码时用的还是帧层的QP,而帧层的QP是由配置文件(即*.cfg中QP: 32 # Quantization parameter(0-51)  这里的32我们可以更改一般设置为22.27.32.37),如果码率控制开启,实际上配置文件中#======== Qu

爬虫学习笔记

爬虫模拟浏览器实例: 方法一.使用build_opener()修改报头 #!/usr/bin/env python # -*-coding:utf-8-*- # __author__="life" import urllib.request url = 'http://blog.csdn.net/justloveyou_/article/details/69611328' # file = urllib.request.urlopen(url) headers = ("Use