python处理编码问题和JSON格式

从文件读出数据：默认utf8编码

json.dumps()输出数据：默认unicode编码

json读取（json是种通用的数据传输格式）

import ujson as json #for performance

jobj = json.loads(json_str) #type(jobj)==<type ‘dict’>

json_str = json.dumps(jobj) #默认输出unicode

json.dumps(jobj, ensure_ascii=False) #输出utf8格式

字符串做key：

>>> s={}

>>> s[1]=((2,3))

>>> json.dumps(s)

‘{"1":[2,3]}’

log，redis，mc_cache，hbase存储都建议使用json格式

python -mjson.tool #json排版显示

ultra json不支持python中long类型：

>>> import json, ujson

>>> json.dumps(18446744073709551616L)

‘18446744073709551616‘

>>> ujson.dumps(18446744073709551616L)

Traceback (most recent call last):

File "<stdin>", line 1, in <module>

OverflowError: long too big to convert

json.dumps输出的字符串手动粘贴置为常量，需要字符串转义，vim操作是s/"/\\"/g

简单介绍：

http://www.ruanyifeng.com/blog/2009/05/data_types_and_json.html

json格式：

http://www.json.org/json-zh.html

http://www.jsoneditoronline.org/

中文编码

def to_utf8(s):

return s if isinstance(s, str) else s.encode(‘utf8‘)

def to_unicode(s):

return s if isinstance(s, unicode) else s.decode(‘utf8‘)

中文unicode不能写文件

空格转utf8后无法用strip()去除

>>> s=u‘ 有的时候，之所以哭泣，并不是因为软弱，而是因为坚强太久。@[email protected]_tab‘

>>> t=u‘有的时候，之所以哭泣，并不是因为软弱，而是因为坚强太久。@[email protected]_tab‘

>>> s

u‘\xa0\u6709\u7684\u65f6\u5019\uff0c\u4e4b\u6240\u4ee5\u54ed\u6ce3\uff0c\u5e76\u4e0d\u662f\u56e0\u4e3a\u8f6f\u5f31\uff0c\u800c\u662f\u56e0\u4e3a\u575a\u5f3a\u592a\u4e45\[email protected][email protected]_tab‘

>>> t

u‘\u6709\u7684\u65f6\u5019\uff0c\u4e4b\u6240\u4ee5\u54ed\u6ce3\uff0c\u5e76\u4e0d\u662f\u56e0\u4e3a\u8f6f\u5f31\uff0c\u800c\u662f\u56e0\u4e3a\u575a\u5f3a\u592a\u4e45\[email protected][email protected]_tab‘

>>> s.strip()

>>> t.strip()

>>> s.encode(‘utf8‘)

‘\xc2\xa0\xe6\x9c\x89\xe7\x9a\x84\xe6\x97\xb6\xe5\x80\x99\xef\xbc\x8c\xe4\xb9\x8b\xe6\x89\x80\xe4\xbb\xa5\xe5\x93\xad\xe6\xb3\xa3\xef\xbc\x8c\xe5\xb9\xb6\xe4\xb8\x8d\xe6\x98\xaf\xe5\x9b\xa0\xe4\xb8\xba\xe8\xbd\xaf\xe5\xbc\xb1\xef\xbc\x8c\xe8\x80\x8c\xe6\x98\xaf\xe5\x9b\xa0\xe4\xb8\xba\xe5\x9d\x9a\xe5\xbc\xba\xe5\xa4\xaa\xe4\xb9\x85\xe3\x80\[email protected][email protected]_tab‘

>>> t.encode(‘utf8‘)

‘\xe6\x9c\x89\xe7\x9a\x84\xe6\x97\xb6\xe5\x80\x99\xef\xbc\x8c\xe4\xb9\x8b\xe6\x89\x80\xe4\xbb\xa5\xe5\x93\xad\xe6\xb3\xa3\xef\xbc\x8c\xe5\xb9\xb6\xe4\xb8\x8d\xe6\x98\xaf\xe5\x9b\xa0\xe4\xb8\xba\xe8\xbd\xaf\xe5\xbc\xb1\xef\xbc\x8c\xe8\x80\x8c\xe6\x98\xaf\xe5\x9b\xa0\xe4\xb8\xba\xe5\x9d\x9a\xe5\xbc\xba\xe5\xa4\xaa\xe4\xb9\x85\xe3\x80\[email protected][email protected]_tab‘

>>> s.encode(‘utf8‘).strip()

>>> t.encode(‘utf8‘).strip()

参考：也谈 Python 的中文编码处理

http://in355hz.iteye.com/blog/1860787

原文地址：https://www.cnblogs.com/yaoyaohust/p/10363099.html

时间： 2024-11-09 16:42:34

python处理编码问题和JSON格式

python处理编码问题和JSON格式的相关文章

python解析url返回的json格式数据

python requests方法post请求json格式处理

Python将JSON格式数据转换为SQL语句以便导入MySQL数据库

PHP中将字符串变量转化成Json格式

python对象和json格式文本之间的转换

Python怎么读写json格式文件

python 读写json文件(dump, load)，以及对json格式的数据处理(dumps, loads)

python 使用json格式转换

Python[7] ：Python制作json格式和shell格式的API