python3中编码和解码

------------恢复内容开始------------

一、python3与python2.7在字符编码上的差异

python2.7 默认编码是和所在的操作系统一致，windows 是 GBK，macOS是 utf8 ,linux是utf8
python3 编码统一规定默认编码为 Unicode

二、python3中str和bytes的区别

　　　　（1）python3有两种数据类型：str 和bytes。

　　　　　　1、编码为Unicode的文本显示为str；

　　　　　　2、其他编码（比如gbk,utf8等）显示为bytes（16进制方式表示）

　　　　（2）在python3中的encode和decode都是相对于Unicode而言的

　　　　　　1、encode()方法是str类型数据拥有的方法，将Unicode编码的数据，转换为其他编码，作为新对象返回

　　　　　　2、decode()方法是bytes类型数据拥有的方法，将其他编码的数据解码为Unicode编码，作为新对象返回

　三、在python3中，汉字的编码及其显示方式

　　例如，输入汉字“中文”时


编码方式	编码二进制格式	在屏幕中的显示
Unicode	‘\u4e2d\u6587‘	"中文"
GBK	b‘\xd6\xd0\xce\xc4‘	b‘\xd6\xd0\xce\xc4‘
UTF8	b‘\xe4\xb8\xad\xe6\x96\x87‘	b‘\xe4\xb8\xad\xe6\x96\x87‘
注解	b:代表bytes类型；\x代表编码是16进制表示；\u表示编码是Unicode

另外，ASCII码可以表示所有到的英文字符，仅占一个字节，ASCII码表示的字符会始终以字符形式在屏幕中显示。

四、当在python3中用open()方法打开文件的注意事项

open()方法有很多参数，其中常用的有

　　　　file:文件所在路径及文件名

　　　　mode:

　　　　　　r：只读，以text的模式打开文件

　　　　　　w：写入，以文本的模式打开文件，且打开时将文件内容清空

　　　　　 b ：以bytes的模式打开文件

a：在文件后添加内容

　　　　　　r+:可读可写，在文件已有文本的后面继续写入

　　　　　　w+:以可读可写方式打开文件，且打开文件时，清空文件，文件不存在则创建文件

　　　　　　encoding:指定解码文件使用的‘编码方式’，比如‘utf8’、‘gbk’等，默认使用操作系统的编码方式。windows默认是GBK, macOS、linux默认使用utf8

------------恢复内容结束------------

原文地址：https://www.cnblogs.com/wl413911/p/12680867.html

时间： 2024-10-06 12:12:36

python3中编码和解码的相关文章

python3中的编解码

#一个知识点是:python3中有两种字符串数据类型:str类型和 bytes类型:sty类型存储unicode数据,bytes类型存储bytes数据 #当我们在word上编辑文件的时候,数据保存之前是以unicode形式保存在内存中的#当我们点击保存时,数据将通过编辑器的编码方式(如UTF-8.gbk)编码成bytes的字节串存储在硬盘上,优势是可以节省存储空间------encode#当我们又重新打开文件时,word又将这些bytes的字节串解码城unicode形式放在内存中,数据就以明文形

Dubbo中编码和解码的解析

(这里做的解析不是很详细,等到走完整个流程再来解析)Dubbo中编解码的工作由Codec2接口的实现来处理,回想一下第一次接触到Codec2相关的内容是在服务端暴露服务的时候,根据具体的协议去暴露服务的步骤中,在DubboProtocol的createServer方法中: 1234567891011 private ExchangeServer createServer(URL url) { ... //这里url会添加codec=dubbo url = url.addParameter(Con

python中编码和解码decode和encode的使用

python 在处理字符串时经常遇到编码错误,导致乱码,且python 2.x和 python 3.x之间有很大的不同,先在这里记录一下,以后整理; 转载文章一篇: http://www.cnblogs.com/evening/archive/2012/04/19/2457440.html

Javascript编码与解码函数

Javascript编码与解码在javascript中编码和解码主要有6个函数,这几个函数在解决前台传中文字符给后台,以及解决乱码问题很有帮助.下面一一介绍.(为了不以讹传讹请自己验证) 1.编码函数:escape(),对应的解码函数:unescape(),基本不用了. escape(charString),charstring 参数是要编码的任意 String 对象或文字. 说明 escape 方法返回一个包含了 charstring 内容的字符串值(Unicode 格式). escape不

java、js的编码、解码

如果在地址栏挂载参数,特别是包含中文,往往要进行编码,取值时再解码,以下是java和js中编码.解码的各自方法. java: @Test public void test3() throws UnsupportedEncodingException{ System.out.println(URLEncoder.encode("我", "UTF-8"));//%E6%88%91 System.out.println(URLDecoder.decode("%E

python3中的编码与解码原理

先看代码 >>> a = '中文' >>> a '中文' >>> print(a) 中文 >>> b = 'English' >>> b 'English' >>> print(b) English 解释编码和解码的过程 >>> aa = a.encode('utf-8') >>> aa b'\xe4\xb8\xad\xe6\x96\x87' >>&g

python中base64编码与解码

引言: 在一些项目中,接口的报文是通过base64加密传输的,所以在进行接口自动化时,需要对所传的参数进行base64编码,对拿到的响应报文进行解码: Base64编码是一种"防君子不防小人"的编码方式.广泛应用于MIME协议,作为电子邮件的传输编码,生成的编码可逆,后一两位可能有"=",生成的编码都是ascii字符.优点:速度快,ascii字符,肉眼不可理解缺点:编码比较长,非常容易被破解,仅适用于加密非关键信息的场合python2中进行Base64编码和解码&g

python3中的编码问题

一提到编码,我们脑子里就会想到unicode, utf-8 ,gbk 等类型的编码. 但事实上,unicode和utf-8,gbk并不是同一级别的代码. python3中,unicode是内存里统一使用的编码,内存里所有的数据(比如str对象)都是用unicode编码的. 可以看到,添加u前缀以后,str对象没变化,说明原本就是unicode 从unicode编码转换成别的类型的编码,这个过程叫编码 (encode) 从别的类型的编码转换为unicode,这个过程叫解码 (decode) 由此你

Python3.X Socket 一个编码与解码的坑

最近在看<Python核心编程>第三版讲述网络编程Socket的知识,在练习中采用Python 3 的代码中遇到一个与编码解码有关的坑,本文将给予详细的介绍. 软件环境 Python: 3.6.0库: socket 问题初见仿照书中的代码(中文版 55-56页) 加上自己的一点改动在我的环境中不能运行,总是报这个错误: 这里是我的客户端Socket代码 from socket import * from time import ctime HOST = 'localhost' PORT =