python unicode

首先感谢python完善的文档，文档从1968年 the American Standard Code （ASCII）开始讲述。

print(type(response))
print(type(response[‘ERRORCODE‘]))
print(type(response[‘RESULT‘]))

类型分别如下:

<type ‘dict‘>
<type ‘unicode‘>
<type ‘unicode‘>

字典类型(以后把这个栗子再完善点)：

dict_demo = {
    "ERRORCODE": unicode(0),
    "RESULT": {
        "accountID": "abc",
        "nickName": "123",
        "tuple": (1,2,3),
        "list": [1,2,3],
        "set":{1,3},
        "dict":{1:1,2:"what?"}
    }
}

最典型的的是根据ERRORCODE的值来判断是否要取“获得“的结果，

origin_data = dict_demo[‘ERRORCODE‘]
print("---------------------")
print("before encode utf-8:")
print("value:", origin_data)
print("type", type(origin_data))
utf8_version = origin_data.encode(‘utf-8‘)
print("---------------------")
print("after encode utf-8:")
print("value:", utf8_version)
print("type", type(utf8_version))
decode_data = utf8_version.decode(‘utf-8‘)
print("---------------------")
print("then decode data back:")
print("value:", decode_data)
print("type", type(decode_data))

结果如下：

---------------------
before encode utf-8:
(‘value:‘, u‘0‘)
(‘type‘, <type ‘unicode‘>)
---------------------
after encode utf-8:
(‘value:‘, ‘0‘)
(‘type‘, <type ‘str‘>)
---------------------
then decode data back:
(‘value:‘, u‘0‘)
(‘type‘, <type ‘unicode‘>)

拓展

更便捷、完善的处理方式?
中文字符输入、输出

时间： 2024-10-13 00:48:54

python unicode的相关文章

Python unicode转义字符\u的处理

Python unicode转义字符\u的处理 python还有更为专业的方法来解决unicode转义字符问题,那就是unicode-escape编码. s = s2.decode("unicode-escape") 就可以了原文地址:https://www.cnblogs.com/fzw-/p/8586257.html

python unicode 和string那?? 开发过程中总是会碰到string, unicode, ASCII, 中文字符等编码的问题, 每次碰到都要现搜, 很是浪费时间, 于是这次狠下心, 一定要搞清楚python 的string和Unicode到底怎么回事. 基础知识我们都知道计算机只认0和1, 要想在计算机显示26个字母, 就要给他们一套映射规则: 计算机能认得的符号 --> 人类可读的符号. 这转换的过程就是一套编码规则. 字符集: 就是一套字符的集合(比如中文4000个汉字集合

Kivy UrlRequest 与 Python unicode 以及 json

UrlRequest The content is also decoded(译码) if the ContentType is application/json and the result automatically(自动地) passed through json.loads. 官方文档中举例: def got_weather(req, results): for key, value in results['weather'][0].items(): print(key, ': ', v

Python Unicode字符串

Unicode字符串字符串还有一个编码问题.因为计算机只能处理数字,如果要处理文本,就必须先把文本转换为数字才能处理.最早的计算机在设计时采用8个比特(bit)作为一个字节(byte),所以,一个字节能表示的最大的整数就是255(二进制11111111=十进制255),0 - 255被用来表示大小写英文字母.数字和一些符号,这个编码表被称为ASCII编码,比如大写字母 A 的编码是65,小写字母 z 的编码是122.如果要表示中文,显然一个字节是不够的,至少需要两个字节,而且还不能和ASCII编

python unicode字节串转成中文问题

如题,其实我的问题很简单,就是在写爬虫的时候拿到网页的信息包含类似“\u65b0\u6d6a\u5fae\u535a\u6ce8\u518c”的字符串,实际上这是unicode的中文编码,对应的中文为“新浪微博注册”.其实我就是想找一个函数让这一串东西显示中文而已,没想到百度了白天找到合适的.遇到这种问题千万不要用什么 “python编码” “unicode中文编码” “unicode解码”这样的关键字去搜,一大堆网页出来毫不相关. 其实这个问题一个函数搞定,如下:Example 1:

Python Unicode编码之基础知识

一.什么是Unicode 在Unicode之前,人们使用ASCII码,即每个英文字符都是以7位二进制数的方式存储在计算机内,其范围是32-126,所以ASCII码字符只能表示95个可打印字符:虽然随后将位数扩展值了8位,但依旧最多只能表示233个字符,对于成千上万的非欧洲语系的语言来说有极大的限制. Unicode通过使用一个或多个字节来表示一个字符的方法,突破了ASCII的限制,可以表示超过90000个字符. 二.怎么使用Unicode 从1.6版本起引进了Unicode字符串支持,用来转换多

Python Unicode编码

使用技巧事实上,只要遵守以下规则,可以规避90%由于Unicode字符串处理引起的bug,剩下的10%通过python的库和模块能够解决. 程序中出现字符串时一定要加个前缀u. 不要用str()函数,用unicode()代替. 不要用过时的string模块--如果传给它的是非ASCII字符,它会把一切搞砸. 不到必须时不要在你的程序里面解码unicode字符.只在你要写入文件或数据库或者网络时,才调用encode()函数:相应地,只在你需要把数据读回来的时候才调用decode()函数. 从现实

Python unicode问题-如何根据引号的内容还原字符

今天写个爬虫, 获取到的中间数据包含类似的unicode的编码,当时一下是觉得挺简单的,后来认真一看,情况有点不一样,正常的unicode如下 >> s = u'中文'>>> su'\u4e2d\u6587' 而获取到的数据,只是引号内的内容,那么问题来了,如何把数据转换为原来的样子? 首先我们知道unicode字符串的格式是u'\xxx', 那么只要能把格式转换回来就可以了.看下面的例子 >>> st = '\u4e2d\u6587'>>>

python unicode转中文及转换默认编码

一. 在爬虫抓取网页信息时常需要将类似"\u4eba\u751f\u82e6\u77ed\uff0cpy\u662f\u5cb8"转换为中文,实际上这是unicode的中文编码.可用以下方法转换: 1. 1 >>> s = u'\u4eba\u751f\u82e6\u77ed\uff0cpy\u662f\u5cb8' 2 >>> print s 3 人生苦短,py是岸 2. 1 >>> s = r'\u4eba\u751f\u82e