python中文和unicode字符串之间的互相转换

首先:中文->unicode字符串

import chardet

import codecs

>>> a = "我是一个中国人"
>>> a
‘\xce\xd2\xca\xc7\xd2\xbb\xb8\xf6\xd6\xd0\xb9\xfa\xc8\xcb‘

>>> chardet.detect(a)
{‘confidence‘: 0.99, ‘encoding‘: ‘GB2312‘}
>>> b = a.decode(‘GB2312‘)

>>> b
u‘\u6211\u662f\u4e00\u4e2a\u4e2d\u56fd\u4eba‘ -->但是我们往往不想要外面的u

>>> c =repr(b)
>>> c
"u‘\\u6211\\u662f\\u4e00\\u4e2a\\u4e2d\\u56fd\\u4eba‘"

>>> d = c[2:-1]
>>> d
‘\\u6211\\u662f\\u4e00\\u4e2a\\u4e2d\\u56fd\\u4eba‘

>>> print d
\u6211\u662f\u4e00\u4e2a\u4e2d\u56fd\u4eba

然后是 unicode  ->中文:

>>> a = ‘\u9a8c‘
>>> a
‘\\u9a8c‘

>>> b = ‘u‘+‘\‘‘+a+‘\‘‘
>>> b
"u‘\\u9a8c‘"
>>> c = eval(b)
>>> c
u‘\u9a8c‘
>>> print c

python中文和unicode字符串之间的互相转换

时间: 2025-01-06 01:55:54

python中文和unicode字符串之间的互相转换的相关文章

SQLServer中日期与字符串之间的互相转换及日期格式

近期项目用到了很多日期转换为字符串.字符串转换为日期的方法,而且也用到了很多日期格式,特整理如下,以备后用. 1.日期转换为字符串.日期格式 使用函数CONVERT: CONVERT ( data_type [ ( length ) ] , expression [ , style ] ) 参数 expression 是任何有效的 Microsoft?nbsp;sql server? 表达式.. data_type 目标系统所提供的数据类型,包括 bigint 和 sql_variant.不能使

C#中文和UNICODE编码转换

C#中文和UNICODE编码转换 //中文轉為UNICODE string str = "中文"; string outStr = ""; if (!string.IsNullOrEmpty(str)) { for (int i = 0; i < str.Length; i++) { //將中文轉為10進制整數,然後轉為16進制unicode outStr += "\\u" + ((int)str[i]).ToString("x&

Java 中基本类型和字符串之间的转换

Java 中基本类型和字符串之间的转换 在程序开发中,我们经常需要在基本数据类型和字符串之间进行转换. 其中,基本类型转换为字符串有三种方法: 1. 使用包装类的 toString() 方法 2. 使用String类的 valueOf() 方法 3. 用一个空字符串加上基本类型,得到的就是基本类型数据对应的字符串 再来看,将字符串转换成基本类型有两种方法: 1. 调用包装类的 parseXxx 静态方法 2. 调用包装类的 valueOf() 方法转换为基本类型的包装类,会自动拆箱 PS:其他基

C++中数字与字符串之间的转换,别人的,

C++中数字与字符串之间的转换 1.字符串数字之间的转换 (1)string --> char *   string str("OK");   char * p = str.c_str(); (2)char * -->string   char *p = "OK";   string str(p); (3)char * -->CString    char *p ="OK";   CString m_Str(p);   //或者

Python中的raw字符串和多行字符串

1.raw字符串(原始字符串) 如果一个字符串包含很多需要转义的字符,对每一个字符都进行转义会很麻烦.为了避免这种情况, 我们可以在字符串前面加个前缀r,表示这是一个 raw 字符串,里面的字符就不需要转义了.例如: r'\(^_^)/ \(~_~)/' raw字符串表示原始字符串,我对于原始的理解就是:你看到这个字符串是什么就显示什么,去掉 所有字符都不进行转义,该显示啥就是啥. 2.多行显示 Python中除了可以使用单引号' '.双引号" "表示一个字符串,还可以使用三引号来表示

Python中的Unicode编码和UTF-8编码

下午看廖雪峰的Python2.7教程,看到 字符串和编码 一节,有一点感受,结合崔庆才的Python博客 ,把这种感受记录下来: ASCII码:是用一个字节(8bit, 0-255)中的127个字母表示大小写字母,数字和一些符号.主要用来表示现代英语和西欧语言. 所以处理中文就出现问题了,因为中文处理至少需要两个字节,所以中国制定了GB2312. 所以,各国制定了各国的标准.日本制定了Shift_JIS,韩国制定了Euc-kr...那么,乱码就来了. 为了统一,Unicode诞生了.统一码把所有

python中列表元组字符串相互转换

python中有三个内建函数:列表,元组和字符串,他们之间的互相转换使用三个函数,str(),tuple()和list(),具体示例如下所示: >>> s = "xxxxx" >>> list(s) ['x', 'x', 'x', 'x', 'x'] >>> tuple(s) ('x', 'x', 'x', 'x', 'x') >>> tuple(list(s)) ('x', 'x', 'x', 'x', 'x')

Python中print/format字符串格式化实例

Python 字符串格式化使用 "字符 %格式1 %格式2 字符"%(变量1,变量2),%格式表示接受变量的类型.简单的使用例子如下 # 例:字符串格式化Name = '17jo'  print 'www.%s.com'%Name  >> www.111cn.net Name = '17jo'Zone = 'com'print 'www.%s.%s'%(Name,Zone)>> www.111cn.net 字符串格式化时百分号后面有不同的格式符号,代表要转换的不

python中json与dict之间转换

Python之dict(或对象)与json之间的互相转化 在Python语言中,json数据与dict字典以及对象之间的转化,是必不可少的操作. 在Python中自带json库.通过import json导入. 在json模块有2个方法, loads():将json数据转化成dict数据 dumps():将dict数据转化成json数据 load():读取json文件数据,转成dict数据 dump():将dict数据转化成json数据后写入json文件 下面是具体的示例: dict字典转jso