交互式的默认编码是系统默认编码
脚本的默认编码是ANSCII (有其他非ANSCII字符如:中文会报错)
指定脚本的默认编码 # -*- coding: encoding -*-
Unicode 可以转 utf-8 和gbk
s_utf = s_uicode.encode(‘utf-8‘)
utf-8 和gbk 转Unicode
s_unicode = s_utf_8.encode(‘utf-8‘)
中文
Unicode 一个
Gbk 两个
Utf-8 三个
>>> gbk = ‘asdf五‘ //当前默认的是gbk >>> gbk ‘asdf\xce\xe5‘ >>> print gbk asdf五 >>> len(gbk) 6 >>> unicode = gbk.decode(‘gbk‘) >>> unicode u‘asdf\u4e94‘ >>> print unicode asdf五 >>> len(unicode) 5 >>> utf_8 = unicode.encode(‘utf-8‘) >>> utf_8 ‘asdf\xe4\xba\x94‘ >>> print utf_8 asdf五 >>> len(utf_8) 7
时间: 2024-08-06 09:04:36