python2与python3默认编码:
python2:gbk print( u‘上‘ ) 操作系统也是 gbk
python3:unicode print( ‘上’ )
字符编码转换关系:
unicode --》encode (编码)--》gbk 其他形式的二进制 write
gbk 其他形式的二进制 --》decode (解码)--》unicode read
各种编码格式与字节对应关系:
bytes ; 字节
ASCIL: 英文1个bytes,中文没有对应关系 ( 65-90:A-Z 97-122)
gbk ; 中文2个bytes,英文1个bytes
unicode ; 中英文2个bytes
utf-8: 中文3个bytes,英文一个bytes
文件头
coding : utf-8
x = ‘上‘ 文件头指定的 utf-8 就是 utf-8 的二进制
原文地址:https://www.cnblogs.com/liu--huan/p/9497569.html
时间: 2024-10-03 00:53:21