python2和python3的编码问题

python2中有两种类型

str字符串和unicode字符串

python3则改成了

bytes和str字符串

在python2中‘xxx’和b‘xxx’都是str字符串，u‘xxx’是unicode字符串，即python3中的bytes在python2是不存在的，都归属于str字符串

在python3中unicode是不存在的，被归并到str字符串里面的，即‘xxx’和u‘xxx’都是str字符串，b‘xxx’是bytes

主要的原因是python2的默认编码是asscii码，而python3的默认编码是utf-8

utf-8相较于asscii能容纳更多的字符，举个例子，utf-8能正常显示中文，而asscii则不行。具体有什么差异就不详细说了。

所以在python2中如果要显示中文需要做编码处理

编码处理的一般方式是

str通过decode函数编码成unicode，然后通过encode编码成str

而python3中可以正常显示中文，不做编码处理也不会有什么大问题

随便说一下python2中str有encode和decode两个函数，encode用来将unicode编码成指定的编码，decode用来将指定编码编码成unicode

encode其实是将字符串变成bytes，因为python2没有bytes所以其还是str字符串。

python3中将bytes和str拆开了，str就只有encode函数可以使用了，使用encode变成bytes之后，bytes类型可以使用decode函数

原文地址：https://www.cnblogs.com/lgh344902118/p/8582606.html

时间： 2024-11-06 03:32:33

python2和python3的编码问题的相关文章

Python2 与 Python3 的编码对比

在 Python 中,不论是 Python2 还是 Python3 中,总体上说,字符都只有两大类: 通用的 Unicode 字符: (unicode 被编码后的)某种编码类型的字符,比如 UTF-8,GBK 等类型的字符. Python2 中字符的类型: str: 已经编码后的字节序列unicode: 编码前的文本字符 Python3 中字符的类型: str: 编码过的 unicode 文本字符bytes: 编码前的字节序列我们可以认为字符串有两种状态,即文本状态和字节(二进制)状态.Pyt

python2与python3 字符问题以及字符编码内容总结

python2与python3默认编码: python2:gbk print( u'上' ) 操作系统也是 gbk python3:unicode print( '上' ) 字符编码转换关系: unicode -->encode (编码)-->gbk 其他形式的二进制 write gbk 其他形式的二进制 -->decode (解码)-->unicode read 各种编码

python2和python3中的编码问题

开始拾起python,准备使用python3, 造轮子的过程中遇到了编码的问题,又看了一下python3和python2相比变化的部分. 首先说个概念: unicode:在本文中表示用4byte表示的unicode编码,也是python内部使用的字符串编码方式. utf-8:在本文中指最少1byte表示的unicode编码方式我在使用 if isinstance(key,unicode): key= key.encode('utf-8') 的时候,发现key值被转成了b'foo',b'bar'

4.python2与python3编码区别，以及字符串与字节的相互转换及其socket编程应用场景

知识点剖析 1.python2与python3的某些区别其实一直想写这篇博客,实则在socket编程中,字符串,字节(byte),和bit流把我弄得晕头转向.确实这也是python3与python2的区别所在.我想在12期的时候,刚从python2转到python3的沛齐与Alex老师也是十分头疼,最近几天查看了相关资料与视频,才恍然大悟. 首先我们看一下下面的实例: 原因:在python2.7中,for循环遇到汉字,依然会按照字节进行循环,那么3个字节才能组成的汉字,单个输出只能时乱码. 解

day07 python2与python3 编码

详细文章: http://www.cnblogs.com/yuanchenqi/articles/5956943.html http://www.diveintopython3.net/strings.html 需知: 1.在python2默认编码是ASCII, python3里默认是unicode 2.unicode 分为 utf-32(占4个字节),utf-16(占两个字节),utf-8(占1-4个字节), so utf-16就是现在最常用的unicode版本, 不过在文件里存的还是utf-

python2和python3编码解码详解

今天让我们一起彻底揭开py编码的真相,包括py2和py3.有同学可能问:以后py3是大势所趋,还有必要了解py2那令人头疼的编码吗?答案是太有必要啦.py2在生产中还是中流砥柱. 什么是编码? 基本概念很简单.首先,我们从一段信息即消息说起,消息以人类可以理解.易懂的表示存在.我打算将这种表示称为"明文"(plain text).对于说英语的人,纸张上打印的或屏幕上显示的英文单词都算作明文. 其次,我们需要能将明文表示的消息转成另外某种表示,我们还需要能将编码文本转回成明文.从明文到编

Python2和Python3的一些语法区别

Python2和Python3的一些语法区别 python Python2和Python3的一些语法区别 1.print 2.input 3. python3版本相对2版本的部分其他区别问题:为何会出现乱码的情况问题:如何获取编码方式的信息? 问题:在控制台上看到的到底是什么? 1.print 在版本2的使用方法是: print 'this is version 2 也可以是 print('this is version 2') 但到了3,就只能加上括号,像一个函数一样来使用 print:

python2 与 python3的区别总结

python2 与 python3的区别总结几乎所有的Python 2程序都需要一些修改才能正常地运行在Python 3的环境下.为了简化这个转换过程,Python 3自带了一个叫做2to3的实用脚本(Utility Script),这个脚本会将你的Python 2程序源文件作为输入,然后自动将其转换到Python 3的形式. 案例研究:将chardet移植到Python 3(porting chardet to Python 3)描述了如何运行这个脚本,然后展示了一些它不能自动修复的情况.这

详解python2 和 python3的区别

看到这个题目大家可能猜到了我接下来要讲些什么,呵呵,对了,那就是列出这两个不同版本间的却别!搜索一下大家就会知道,python有两个主要的版本,python2 和 python3 ,但是python又不同于其他语言,向下兼容,python3是不向下兼容的,但是绝大多数组件和扩展都是基于python2的,下面就来总结一下python2和python3的区别. 1.性能 Py3.0运行 pystone benchmark的速度比Py2.5慢30%.Guido认为Py3.0有极大的优化空间,在字符串和

猜你喜欢

Linux下四款Web服务器压力测试工具（http_load、webbench、ab、siege）介绍

一.http_load程序非常小,解压后也不到100Khttp_load以并行复用的方式运行,用以测试web服务器的吞吐量与负载.但是它不同于大多数压力测试工具,它可以以一个单一的进程运行,一般不会把 ...

看图说说JVM老年代垃圾收集器

注:G1垃圾收集器是目前最前沿的GC收集器,未来将取代CMS垃圾收集器,可以作为整个Heap的收集器使用,不限于老年代!!!

设计模式十之状态模式1

状态模式,允许对象在内部状态改变时改变它的行为,对象看起来好像修改了它的类. 这个模式将状态封装成为独立的类,并将动作委托到代表当前状态的对象,我们知道行为会随着内部状态而改变.糖果机提供了一个很好地 ...

Bash 2.x提供了创建一维数组的能力. 有多种方法创建,用内建命令declare -a或直接数组元素赋值. 向数组赋值时,如果不指定下标,下标自动从0开始,每次增加1. 数组的尺寸没有限制,下标也 ...

Swift编程语言学习2.2——基本运算符(下）

三元条件运算(Ternary Conditional Operator) 三元条件运算的特殊在于它是有三个操作数的运算符,它的原型是问题?答案1:答案2.它简洁地表达根据问题成立与否作出二选一的操作. ...

安装matplotlib的步骤

方法: 首先matplotlib是需要numpy先行包支持的,这里,我已经安装了numpy,下面安装matplotlib. matplot需要一些其他软件支持 (1)这时需要安装freetype 和 ...

XML与HTML区别,XML解析

1.XML与HTML的区别 XML 不是对 HTML 的替代 ,XML 是对 HTML 的补充. XML 不会替代 HTML,理解这一点很重要.在大多数 web 应用程序中,XML 用于传输数据,而 ...

一些关于C#发送邮件的代码

1.命名空间 using System.Net.Mail; 2.创建一个MailMessage类的对象 [csharp] view plaincopy MailMessage mail = new M ...

location属性解释 - window.location & $location

window.location 所有浏览器都支持 window 对象.它表示浏览器窗口.所有 JavaScript 全局对象.函数以及变量均自动成为 window 对象的成员. 全局变量是 windo ...

上传Apk至测试服务器

通过服务器, 同步测试与开发. 上传Apk至服务器, 测试在服务器内下载测试包, 即时反馈即时修改, 同步进行, 需要在公司内网. 1. 配置ssh 在.ssh文件夹下, 添加文件is_ras_upl ...

Oracle 学习之RMAN（十五）恢复实战--TSPITR

TSPITR是英文Tablespace Point In Time Recovery的缩写.也就是表空间定点时间恢复.TSPITR是一种相对细粒度的不完全恢复技术.我们通常见到的还原操作,都是将所有的 ...

进口货规范的地方规划局可

http://www.gettyimages.cn/newsr.php?thekeyword=%A8%7D%D6%DB%C9%BD%C5%E7%CE%ED%D0%CD%C3%D4%D2%A9%C4%C ...

【转】Google是如何做代码审查的？

Google是一个非常优秀的公司.他们做出了很多令人称赞的东西—既是公司外部,人们可以看到的东西,也是公司内部.有一些在公司内部并不属于保密的事情,在外部并没有给予足够广泛的讨论.这就是我今天要说的. ...

虚拟化介绍

虚拟化介绍虚拟化分类: 硬件级别: 通过VMM分配和管理硬件,操作系统运行在.如VM上,vmware.virtualbox.xen.kvm 软件级别: 通过模拟器模拟硬件.如qemu 操作系统级别: ...

JVM -Xss调整Stack Space的大小【转】

Java程序中,每个线程都有自己的Stack Space.这个Stack Space不是来自Heap的分配.所以Stack Space的大小不会受到-Xmx和-Xms的影响,这2个JVM参数仅仅是影响 ...

SqlHelper重构

在机房重构的时候有用到SqlHelper(点击查看),当时什么都不懂.后来经过不断的使用,开始理解其中的意思.后来发现原来的SqlHelper写的有点繁琐.对于每个操作都需要写两次,来区分是否带参数. ...

ps基础实例操作

运用ps的基础工具进行常用图片处理魔棒工具 ps5魔棒工具儿童照片加边框魔棒抠图放入背景边框

Delphi写的DLL回调C#

C#的调用Delphi的DLL没有问题,DLL回调时遇到了麻烦,网上找了个方法,解决了这个问题 Delphi部分,列举了三种回调函数定义 [delphi] view plain copy librar ...

bash: service: command not found 错误的解决方法

转载:http://blog.sina.com.cn/s/blog_4a4f69910100i493.html 今天碰到一个问题,问题如下:在启动named服务时,出现下面错误提示: bash: se ...

【HTML5】音频视频

1 <!DOCTYPE html> 2 <html> 3 <head> 4 <meta charset="utf-8"> 5 < ...

专题

随机推荐

© 2024 憋错料 | info#biecuoliao.com | 10 q. 0.026 s.