中文的字符编码 是 gbk windows 默认的字符编码也是gbk
每个国家都有自己的字符编码 为了 统一 就有了
unicode
##unicode 不管英文中文都占 2个字节 16位
ascii码 一个英文一个字节 不能存中文。。 8 位 英文 或特殊字符
转换后 中文 变成3个字节
其中utf-8 是 Unicode的 可变长度的扩展级
encode 是编码 decode 是 解码
import sysprint(sys.getdefaultencoding()) ### 查看系统编码是 什么
utf-8 转换成 gbk
1,首先你要去Unicode 里告诉 它 我是 utf-8 decode()解压
2 然后再编码成 gbk 格式 显示
gbk 转换 utf-8
1,首先去unicode 里告诉自己是 gbk decode(‘gbk‘)
2 , 然后再编码成 utf-8 展现 encode(‘utf-8‘)
以上 Python2.x 操作。
原文地址:https://www.cnblogs.com/th-lyc/p/8545366.html
时间: 2024-11-05 23:22:37