PYTHON 之 字符编码的区别与介绍

理解字符编码的历史与使用原因

1、计算机只能认0与1。
2、通过0与1,二进制数,计算机能很容易识别出各种数字。
3、为了能让计算机识别各种字符,美国人制定了ASCII码,能识别出127种字母与特殊字符,只需使用一个字节。
3、因为ASCII码不支持中文,在1980设计出gb2312 ,收录了7445个汉字。
4、到了1995年 设计出BGK1.0 收录了2万多个汉字。
5、到了2000年,设置出GB18030 收录了2万7千多个汉字。
6、到了不个不知道什么年份的时候,国际组织为了统一全世界的字符,设置出unicode ,使用了2个字节
7、后面又设置出现在的utf-8可变长字符编码,为了解决英文字符只占用一字节的大小(不要浪费空间吗),此时的的英文是:1byte, 中文:3bytes

关于python2的版本是不支持中文字符的,而只支持ASCII码,意思是只支持英文或特殊字符的显示。

为了能使python2能显示中文,必须在代码前加上以下字符:

备注:PYTHON3默认直接使用的字符编码就是UTF-8,可直接使用中文字符

原文地址:http://blog.51cto.com/12965094/2343198

时间: 2024-08-24 18:09:46

PYTHON 之 字符编码的区别与介绍的相关文章

字符编码的区别与介绍

8位一个字节,1字节=1bytes 字符编码的发展史: ASCII码:255个字符,每个字符只占1bytes >> 1980年: GB2312,7000多个汉字 >>1995年:GBK1.0,20000多个汉字 >>2000年:GB18030,27000多个汉字 >>90年代,出现Unicode(万国码,统一码,单一码),每个字符占2bytes >>utf-8:Unicode的扩展集.en:2bytes:zh:3bytes python3里面默认

Python常见字符编码间的转换

学习Python,字符编码间的转换是绕不过去的一只拦路虎,不把编码彻底搞明白,总有一天它会猝不及防坑你一把. Python2.x和Python3.x在字符编码的设置上也有很大区别(Python3未来将是主流,所以Python3为主),今天我们就来一起学习下. 上一篇文章里我已经简述了Python的常见编码了,这里就不再赘述了,还不清楚的小伙伴可以先去看下:     http://www.cnblogs.com/schut/p/8406897.html 一.Unicode 和 UTF-8的纠葛 U

Python2和3字符编码的区别

Python2和3字符编码的区别 一.字符编码应用之Pyhton 1.1执行Python程序的三个阶段 test.py文件内容以gbk格式保存的,内容为: 阶段一:启动Python解释器 阶段二:Python解释器此时就是一个文本编辑器,负责打开文件test.py,即从硬盘中读取test.py的内容到内存中 此时,Python解释器会读取test.py的第一行内容,#coding:utf-8或#-*-coding:utf-8-*-,以此决定以什么编码格式将代码读入内存,这一行就是设定Python

python 处理字符编码问题

今天好不容易重新开始写Python做实验,结果被字符编码虐的体无完肤.其实之前就已经比较清楚python处理字符编码的套路,但是今天白天反复的出现can't encode/decode ..., the original code not in 178之类的提示,甚是无力,后来偶尔使用了一下sys.setdefaultencoding('utf8')就解决了全部问题,真是不解. 下面还是总结一下Python几个编码设置的含义吧. 1. #coding=utf8 这种形式的注释告诉解释器,应该以c

ASCII,Unicode,GBK和UTF-8字符编码的区别联系

ASCII,Unicode,GBK和UTF-8字符编码的区别联系 wyrssktzc11级分类:其他被浏览86次2016.05.27 检举 KingSta逍遥 采纳率:45%7级2016.05.27 ASCII.Unicode.GBK和UTF-8字符编码的区别联系 很久很久以前,有一群人,他们决定用8个可以开合的晶体管来组合成不同的状态,以表示世界上的万物.他们看到8个开关状态是好的,于是他们把这称为"字节".再后来,他们又做了一些可以处理这些字节的机器,机器开动了,可以用字节来组合出

python之----------字符编码具体原理

1.内存和硬盘都是用来存储的. CPU:速度快 硬盘:永久保存 2.文本编辑器存取文件的原理(nodepad++,pycharm,word) 打开编辑器就可以启动一个进程,是在内存中的,所以在编辑器编写的内容也都是存放在内存中的,断电后数据就丢失了.因而需要保存在硬盘上,点击保存按钮或快捷键,就把内存中的数据保存到了硬盘上.在这一点上,我们编写的py文件(没有执行时),跟编写的其他文件没有什么区别,都只是编写一堆字符而已. 3.python解释器执行py文件的原理,例如python  test.

python之字符编码(四)

一.字符编码的使用: 1.文本编辑器 unicode----->encode-------->utf-8 utf-8-------->decode---------->unicode 补充: 浏览网页的时候,服务器会把动态生成的Unicode内容转换为UTF-8再传输到浏览器 如果服务端encode的编码格式是utf-8, 客户端内存中收到的也是utf-8编码的结果. 2.文本编辑器nodpad++: 分析过程?什么是乱码 文件从内存刷到硬盘的操作简称存文件 文件从硬盘读到内存的操

python版本与编码的区别

主要编码介绍 python解释器在加载 .py 文件中的代码时,会对内容进行编码(默认ascill) ASCII(American Standard Code for Information Interchange,美国标准信息交换代码)是基于拉丁字母的一套电脑编码系统,主要用于显示现代英语和其他西欧语言,其最多只能用 8 位来表示(一个字节),即:2**8 = 256,所以,ASCII码最多只能表示 256 个符号. 显然ASCII码无法将世界上的各种文字和符号全部表示,所以,就需要新出一种可

第六节,初识python和字符编码

程序语言的发展 机器语言 程序语言,最初的计算机语言是机器语言,完全是0和1组成的二进制串  如:01010101 11010101 汇编语言 因为01010101的字符串,冗长,不利于维护,所以产生了带助记符的汇编语言 举例:fua = 01010101    fub = 11010101 c语言 在汇编的基础上开发了c语言 有了常量,变量,字符串,等运算规则 java.c#.php.python 在c语言的基础长有发展了java.c#.php.python 等各种语言 这些语言都需要安装运行