由于计算机是美国人发明的,所以计算机最开始只能识别256个字符(ASCII码),而你在计算机中输入中文就会报错
而中国人想让计算机认识中文,就重新编写了一套支持中文的编码(GB2312)
随后由于GB2312编码支持的中文汉字有限(繁体字大多都不支持),国人又扩充了编码库,从而产生了GBK
同样,日本人,韩国人。。。等其他国家的人也想用计算机,就弄了一套他们国家自己的编码
为了保证编码库的统一(哪国写的都认识),诞生了Unicode编码,但Unicode编码最少使用2个字节(太浪费内存了)
后来就有了utf-8,utf-8的优点就是根据字符自动分配空间(例如,英文8位,中文24位)
在python2.7中默认使用的ASCII码,因此要想python2.7支持中文,需要修改编码
例:
在代码的顶端声明编码格式
# -*- coding:utf-8 -*-
注意:3.0以上的版本默认编码为UTF-8,就不需要此声明了
时间: 2024-10-26 03:49:08