python字符编码与解码 unicode，str

字符编码

　　计算机中的字符都是以特定的编码形式存放的，从最早的ascii到后来的Unicode以及UTF-8，在python中，字符串str也是是区分编码的，在各种编码的字符串之间，有一座桥梁，就是unicode类型。

str, unicode

　　str转到unicode需要解码，即decode；反之，unicode转到str需要编码，即encode：

　　str -- (decode) --> unicode

　　unicode -- (encode) --> str

　　str也可以直接用encode方法把一种编码的str转到另外一种编码的str，其实表面上的直接转码还是经过了先解码后编码的过程，就是说：str.encode()等价于str.decode(sys.defaultencoding).encode()，sys.defaultencoding是python默认编码，一般是ascii编码。类似地，对于unicode类型，也有：unicode.decode()等价于unicode.encode(sys.defaultencoding).decode()。

例子代码：

 1 #!/usr/bin/env python
 2 # -*- coding: utf-8 -*-
 3 # @Time    : 2017/7/17 22:09
 4 # @Author  : dswang
 5
 6 import sys
 7
 8 if __name__ == ‘__main__‘:
 9     print sys.getdefaultencoding()
10     x = ‘严‘
11     print type(x)
12     print repr(x)
13
14     y = x.decode(‘utf-8‘)
15     print type(y)
16     print repr(y)
17
18     z = y.encode(‘gb2312‘)
19     print type(z)
20     print repr(z)

结果为：

ascii
<type ‘str‘>
‘\xe4\xb8\xa5‘
<type ‘unicode‘>
u‘\u4e25‘
<type ‘str‘>
‘\xd1\xcf‘

说明：文件头注释中的-*- coding: utf-8 -*-用来指明文件的编码方式为utf-8，代码中str的编码也默认为utf-8。

参考文章

【1】字符编码笔记：ASCII，Unicode和UTF-8 by 阮一峰

时间： 2024-08-05 19:08:37

python字符编码与解码 unicode，str的相关文章

python第三天学习复习，集合set，文件操作，函数（普通函数，递归，高阶函数），字符编码和解码

三元运算 age = 23 #就是if else的简单写法 a = age if age < 20 else 25 集合 set #集合是无序切不重复的, #当对列表去重复的时候,可以直接使用 set(list),就将list转为set,并去除中间重复的 list = [1,2,3,4,5,5,6,7,8,9,1] s = set(list) 运行结果:可以发现将 list中重复的去掉,并且类型变成set,再使用list(set),转为list 集合操作 # Author:zylong set1

python字符编码

1. 字符编码简介阶段一:现代计算机起源于美国,最早诞生也是基于英文考虑的ASCII ASCII:一个Bytes代表一个字符(英文字符/键盘上的所有其他字符),1Bytes=8bit,8bit可以表示0-2**8-1种变化,即可以表示256个字符 ASCII最初只用了后七位,127个数字,已经完全能够代表键盘上所有的字符了(英文字符/键盘的所有其他字符) 后来为了将拉丁文也编码进了ASCII表,将最高位也占用了阶段二:为了满足中文,中国人定制了GBK GBK:2Bytes代表一个字符为了满

【转】Python字符编码详解

1. 字符编码简介 1.1. ASCII ASCII(American Standard Code for Information Interchange),是一种单字节的编码.计算机世界里一开始只有英文,而单字节可以表示256个不同的字符,可以表示所有的英文字符和许多的控制符号.不过ASCII只用到了其中的一半(\x80以下),这也是MBCS得以实现的基础. 1.2. MBCS 然而计算机世界里很快就有了其他语言,单字节的ASCII已无法满足需求.后来每个语言就制定了一套自己的编码,由于单字节

python 字符编码处理问题总结彻底击碎乱码！

Python中经常遇到这样的字符编码问题,尤其在处理网页源码时(特别是爬虫中): UnicodeDecodeError: 'XXX' codec can't decode bytes in position 12-15: illegal multibyte... 下面以汉字'哈'来解释作示例解释所有的问题,汉字"哈"的各种编码如下: 1 UNICODE(UTF8-16): 0xC854 2 UTF-8: 0xE59388 3 GBK: 0xB9FE 除此之外还有如gb2312,

Python字符编码详解(转)

1. 字符编码简介 1.1. ASCII ASCII(American Standard Code for Information Interchange),是一种单字节的编码.计算机世界里一开始只有英文,而单字节可以表示256个不同的字符,可以表示所有的英文字符和许多的控制符号.不过ASCII只用到了其中的一半(\x80以下),这也是MBCS得以实现的基础. 1.2. MBCS 然而计算机世界里很快就有了其他语言,单字节的ASCII已无法满足需求.后来每个语言就制定了一套自己的编码,由于单字节

Python字符编码 zz

http://www.cnblogs.com/huxi/archive/2010/12/05/1897271.html 1. 字符编码简介 1.1. ASCII ASCII(American Standard Code for Information Interchange),是一种单字节的编码.计算机世界里一开始只有英文,而单字节可以表示256个不同的字符,可以表示所有的英文字符和许多的控制符号.不过ASCII只用到了其中的一半(\x80以下),这也是MBCS得以实现的基础. 1.2. MBC

python 字符编码详解

1. 字符编码简介 1.1. ASCII ASCII(American Standard Code for Information Interchange),是一种单字节的编码.计算机世界里一开始只有英文,而单字节可以表示256个不同的字符,可以表示所有的英文字符和许多的控制符号.不过ASCII只用到了其中的一半(\x80以下),这也是MBCS得以实现的基础. 1.2. MBCS 然而计算机世界里很快就有了其他语言,单字节的ASCII已无法满足需求.后来每个语言就制定了一套自己的编码,由于单字节

Python字符编码详解

1. 字符编码简介 1.1. ASCII ASCII(American Standard Code for Information Interchange),是一种单字节的编码.计算机世界里一开始只有英文,而单字节可以表示256个不同的字符,可以表示所有的英文字符和许多的控制符号.不过ASCII只用到了其中的一半(\x80以下),这也是MBCS得以实现的基础. 1.2. MBCS 然而计算机世界里很快就有了其他语言,单字节的ASCII已无法满足需求.后来每个语言就制定了一套自己的编码,由于单字节

Python字符编码很难吗？今天一文带你深入！从此不再疑惑！

不论你是有着多年经验的 Python 老司机还是刚入门 Python 不久,你一定遇到过UnicodeEncodeError.UnicodeDecodeError 错误,每当遇到错误我们就拿着 encode.decode 函数翻来覆去的转换,有时试着试着问题就解决了,有时候怎么试都没辙,只有借用 Google 大神帮忙,但似乎很少去关心问题的本质是什么,下次遇到类似的问题重蹈覆辙,那么你有没有想过一次性彻底把 Python 字符编码给搞懂呢? 完全理解字符编码与 Python 的渊源前,我们有

猜你喜欢

我的git与github学习历程

因为想要知道如何把代码放到github上,所以就百度了一下,然后找到一个<如何从github上面拷贝源码>的文章,就先进行练习了下 1.首先到git官网下载git版本控制工具的安装包,下载 ...

高性能Web服务之nginx应用详解

一.Nginx特性 * *模块化,目前只能将模块编译进Nginx,暂时不支持动态装卸模块.(httpd优势) * *可靠性,一个主进程(master)控制多个工作进程(worker),工作进程响应用户 ...

为了【眼睛】拼了,意康绿全场钜惠，关注微信买一送一！~

您是否是电脑控.手机党.熬夜族.驾驶队的一员,也同样饱受环境污染.强力紫外线和各种辐射的困扰,模糊了清澈的心窗,渐失明察秋毫的锐利!!那么问题来了,有没有一种既健康又轻松的解决方法呢? 梦想还是要有的 ...

【51CTO学院三周年】藏头诗一首送祝福

5 十知天命,二十年信息化 1 生最执着,从不虚度年华 C 语言入门,迈进电脑世界 T 台秀人生,台上我自拼搏 O K伴成功,头脑决定生活学习靠环境,喜与51相握院内无高楼,神交老师多多三 ...

CentOS 安装最新版 Git

CentOS 6.8 自带的 Git 版本为 1.7.1,比较旧,yum 安装也停留在 1.7.1,还是源码编译安装吧. 下载源码: wget -c https://github.com/git/gi ...

bc 一周年 1001 Souvenir (hdu 5310)

Souvenir Accepts: 901 Submissions: 2743 Time Limit: 2000/1000 MS (Java/Others) Memory Limit: 262144/ ...

ListView中的setOnScrollListener

ListView是Android中最常用的控件之一,随着时代发展,RecyclerView有取代它的趋势,但是在一些老代码中,ListView依然扮演着重要的作用.项目中遇到一个需求,需要监听List ...

Arc Engiene读取文档的属性

设计界面创建类代码如下 using System; using System.Collections.Generic; using System.Linq; using System.Text; ...

CLI命令模式下Call to undefined function mysql_connect()

背景: http访问一切正常,可以connect到数据库存取数据.但是当CLI模式时会出现Call to undefined function mysql_connect() 原因:CLI模式下没有 ...

Tab标签栏切换权威总结

angular的标签栏,有两种方法实现: 内容全部加载到页面中,再利用ng-show指令. 将每一块要加载的内容做成模板,利用ng-if指令加载. 详细例子如下: ng-show <script ...

NancyFx是一个轻量级的web开发框架(基于.net),我使用它,主要是它可以不依赖IIS(因为我当前的项目都是轻量级的BS框架),可以selfhost. Nancy的网址为:http://nan ...

Nginx: error while loading shared libraries: libpcre.so.1解决

Shell代码 [[email protected] conf]# /usr/local/nginx/sbin/nginx /usr/local/nginx/sbin/nginx: error whi ...

Android系统集成Google Maps和Google Search apk注意事项

最近公司由于要参加国际上的某个show,需要集成Google Maps和Google Search的apk,注意是源码集成.在此过程中遇到一些坑,总结下来希望大家注意,以后遇到类似问题可以参考. 大家 ...

linux下实现ls()函数遍历目录

需求:在linux下遍历目录,输出目录中各文件名. 在linux下遍历目录的相关函数有: #include <dirent.h> DIR* opendir(const char* dir_ ...

java判断字符串是否为乱码

项目中有一个功能在IE中GET方式提交会产生乱码但有两个入口都会走这同一段代码固不能直接转码,所以要进行判断传过来的该值是不是乱码可用以下方式验证: java.nio.charset.Char ...

合并dict、list的方法

dict1={1:[1,11,111],2:[2,22,222]}dict2={3:[3,33,333],4:[4,44,444]}合并两个字典得到类似 {1:[1,11,111],2:[2,22,2 ...

ThinkPHP学习(二)

书接前文. 我想前台填写内容,然后在后台保存一下,规划了一下前台要录入的内容,主要包括title.content两大内容.然后简单设计了一个前台页面(复杂的我得会啊),就在上篇文章的基础上直接加了: ...

scala-尾递归

------------------------- by chenkh ----------------------------- 随笔记录什么是尾递归,为什么需要尾递归,尾递归show by exa ...

Sharepoint2013 webpart 使用Jquery+json数据实现的菜单。

Sharepoint2013 webpart 使用Jquery+json数据实现的菜单. 分类: sharepoint2014-11-17 14:17 215人阅读评论(0) 收藏举报把代码块1 ...

Apache报错

[问题一]在安装apr-utli时,make时出现以下错误 [[email protected] apr-util-1.6.0]# make make[1]: Entering directory ` ...

专题

随机推荐

© 2024 憋错料 | info#biecuoliao.com | 10 q. 0.018 s.