编码的发展过程:
美国ASCII码:1个字节
↓
各国编码,如中国GB2312编码:2个字节
↓
统一编码:Unicode 通常为2个字节,字节固定,浪费
↓
UTF-8:将Unicode的字节 自动缩减合适字节存储,字母为1个字节,普通汉字为3个字节
字符 | ASCII | Unicode | UTF-8 |
---|---|---|---|
A | 01000001 | 00000000 01000001 | 01000001 |
中 | 无 | 01001110 00101101 | 11100100 10111000 10101101 |
ASCII字符与数字转换:
#!/usr/bin/python
a = 65;
print ord('a'); #字符转数字
print chr(a); #数字转字符
汉字字符输出:
#!/usr/bin/python
# -*- coding: utf-8 -*- ##告诉Python解释器,按照UTF-8编码读取源代码
print u'文'; #u'...' 用unicode编码字符输出
原文地址:http://blog.51cto.com/13502993/2140670
时间: 2024-10-22 04:01:39