一篇文章助你理解Python3中字符串编码问题

前几天给大家介绍了unicode编码和utf-8编码的理论知识，以及Python2中字符串编码问题，没来得及上车的小伙伴们可以戳这篇文章：浅谈unicode编码和utf-8编码的关系和一篇文章助你理解Python2中字符串编码问题。下面在Python3环境中进行代码演示，分别Windows和Linux操作系统下进行演示，以加深对字符串编码的理解。

在Python2的Python文件的文件头往往会声明字符的编码格式，通过会使用代码“#-*- coding -*-”作为编码声明，如下图所示。

因为考虑到Python文件中可能会穿插中文，不然的话Python通过解释器来读取文件的时候，文件中的中文就有可能识别不了。而在Python3中，我们就不必像Python2的文件那样进行声明编码格式了，因为在Python3中，默认将所有的字符都视为unicode格式了。下面在Python3环境下进行代码演示。

1、首先在Windows操作系统下的Python3环境中进行演示，如下图所示。

可以看到str1就是一个中文的字符串，字符串前面也没有加u以表示其为unicode编码，其实也没有必要加那个字符，因为在Python3中将所有的字符都内置成unicode字符了，这就是Python2和Python3最大的区别。所有在这里可以直接调用encode()函数对字符串进行编码，而且也不会报错。

2、接下来在Linux操作系统下的Python3环境中进行演示，如下图所示。

这个过程和Windows下是一样的，这里就不再赘述了。有个地方需要注意的是在Linux操作系统下，Python3的默认环境编码变为了utf-8编码，而不是Python2中的ASCII编码。

总的来说，Python3解决了一个字符串编码的重要问题，所以在字符串编码的报错方面相对Python2来说要少的多，帮助我们省下了很多事情。小伙伴们，关于在Python2和Python3中字符串的编码问题这个知识点十分重要，希望大家都可以get到噢~~

原文地址：https://www.cnblogs.com/dcpeng/p/10121684.html

时间： 2025-01-02 17:19:57

一篇文章助你理解Python3中字符串编码问题的相关文章

一篇文章助你理解Python2中字符串编码问题

前几天给大家介绍了unicode编码和utf-8编码的理论知识,没来得及上车的小伙伴们可以戳这篇文章:浅谈unicode编码和utf-8编码的关系.下面在Python2环境中进行代码演示,分别Windows和Linux操作系统下进行演示,以加深对字符串编码的理解. 1.首先在Windows操作系统下的Python2环境中进行演示,我们都知道Python2中的编码问题经常出现,需要通过编码(encode)和解码(decode)进行实现.通过cmd进入命令行窗口,然后输入两个字符串'abc'和u'a

python3中的编码

python2字符串编码存在的问题: 使用 ASCII 码作为默认编码方式,对中文处理不友好把字符串分为 unicode 和 str 两种类型,将unicode作为唯一内码,误导开发者 python3中默认编码方式修改为utf-8. 在存储和显示上,python3使用文本字符和二进制数据进行区分,更加明确和清晰. 文本字符使用str类型表示,str 能表示 Unicode 字符集中所有字符,而二进制数据使用bytes类型表示. str与bytes之间的转换一种方式 # bytes objec

php中字符串编码

php中抓取网页拼接url的时候经常需要进行编码,这时候就用到两个函数 mb_detect_encoding - 检测字符的编码. mb_convert_encoding - 转换字符的编码 ? 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 <?php /* 使用当前的 detect_order 来检测字符编码 */ echo mb_detect_encoding($str); /* "auto" 将根据 mbstring.language 来扩展

python3中的编码与解码原理

先看代码 >>> a = '中文' >>> a '中文' >>> print(a) 中文 >>> b = 'English' >>> b 'English' >>> print(b) English 解释编码和解码的过程 >>> aa = a.encode('utf-8') >>> aa b'\xe4\xb8\xad\xe6\x96\x87' >>&g

python2和python3中的编码问题

开始拾起python,准备使用python3, 造轮子的过程中遇到了编码的问题,又看了一下python3和python2相比变化的部分. 首先说个概念: unicode:在本文中表示用4byte表示的unicode编码,也是python内部使用的字符串编码方式. utf-8:在本文中指最少1byte表示的unicode编码方式我在使用 if isinstance(key,unicode): key= key.encode('utf-8') 的时候,发现key值被转成了b'foo',b'bar'

python3中的编码问题

一提到编码,我们脑子里就会想到unicode, utf-8 ,gbk 等类型的编码. 但事实上,unicode和utf-8,gbk并不是同一级别的代码. python3中,unicode是内存里统一使用的编码,内存里所有的数据(比如str对象)都是用unicode编码的. 可以看到,添加u前缀以后,str对象没变化,说明原本就是unicode 从unicode编码转换成别的类型的编码,这个过程叫编码 (encode) 从别的类型的编码转换为unicode,这个过程叫解码 (decode) 由此你

Python2 和 Python3 中默认编码的差异

最近在使用 Python3.4 做一些脚本实现,发现对于编码的处理上和 Python2.6 有很大的不同,就此机会把相关知识做个梳理,方便需要的时候查阅. 先说下概念和差异: 脚本字符编码:就是解释器解释脚本文件时使用的编码格式,可以通过 # -\*- coding: utf-8 -\*- 显式指定解释器字符编码:解释器内部逻辑过程中对 str 类型进行处理时使用的编码格式Python2 中默认把脚步文件使用 ASCII 来处理(历史原因请 Google)Python2 中字符串除了 str 还

python中字符串编码转换

字符串编码转换程序员最苦逼的地方,什么乱码之类的几乎都是由汉字引起的. 其实编码问题很好搞定,只要记住一点: 任何平台的任何编码,都能和Unicode互相转换. UTF-8与GBK互相转换,那就先把UTF-8转换成Unicode,再从Unicode转换成GBK,反之同理. 注意:在python3中encode,在转码的同时还会把string 变成bytes类型,decode在解码的同时还会把bytes变回string # 这是一个 UTF-8 编码的字符串 utf8Str = "你好地球&quo

【转载】Perl中字符串编码的处理

在 Perl看来, 字符串只有两种形式. 一种是octets, 即8位序列, 也就是我们通常说的字节数组. 另一种utf8编码的字符串, perl管它叫string. 也就是说: Perl只熟悉两种编码: Ascii(octets)和utf8(string). utf8 flag在perl内部, 字符串结构由两部分组成: 数据和utf8 flag. 比如字符串"中国"在perl内部的存储是这样:utf8 flag 数据On 中国假如utf8 flag是On的话, perl就会把中国当成

猜你喜欢

Linux系统中终端的入口

需求: 登陆通过SSH登陆Linux主机,主机只能执行特定脚本或程序,如何约束? 首先配置/etc/bash.bashrc 该文件每次打开新的shell都会执行该文件: 添加执行脚本或程序路径到bas ...

Python学习笔记3：简单文件操作

# -*- coding: cp936 -*- # 1 打开文件 # open(fileName, mode) # 參数:fileName文件名称 # mode打开方式 # w 以写方式打开. ...

移动端一些小问题

一.点击穿透: 原因: 1. touch事件300ms后,触发click事件: 2. 混用touch和click会导致点透问题. 解决思路: 1.不要混用touch和click: 2.阻止掉 touc ...

如何自动输入密码ssh连接到其他机器

想在shell脚本里ssh连接到另外一台服务器后执行一些命令,但是不希望通过交互方式输入登录密码. 主要的解决方法有三种: 1. 生成ssh公钥,建立和对方机器的信任关系: 2. 使用expect脚本 ...

poj3463 Sightseeing --- dij最短路和次短路

最短路好题啊. 题目给定起点和终点,要求最短路和次短路(要求次短路只比最短路大1)的道路数量. 重点在于次短路如何处理是最高效的呢这就要求对dij算法路径更新的理解了. 我们用一个数组记录最短路,一 ...

安装和部署ZkeaCMS

ZkeaCMS是基于EasyFrameWork,使用ASP.NET MVC4开发的开源CMS. ZkeaCMS一个内容管理软件(网站).ZkeaCMS不仅只是管理内容,更是重新定义了布局.页面和组件, ...

PHP的垃圾回收机制详解

最近由于使用php编写了一个脚本,模拟实现了一个守护进程,因此需要深入理解php中的垃圾回收机制.本文参考了PHP手册. 在理解PHP垃圾回收机制(GC)之前,先了解一下变量的存储. php中变量存在 ...

3-2 PHP-压力测试工具使用演示

D:\all\phpstudy\Apache\bin>ab -c 10 -n100 www.qzrc.com/ This is ApacheBench, Version 2.3 <$Rev ...

Chrome扩展开发之Chrome扩展的文件结构

一个Chrome扩展包括一系列文件,HTML文件.CSS样式文件.JavaScript脚本.图片等,以及一个最有特点的manifest.json. 1. manifest.json是啥它是每个chr ...

mongdb 主从搭建

mongo主从副本集一,mongo 主从 mongo的主从配置 1,主从同步原理,从库通过去读取主库的oplog来实现数据的同步弊端: 主从不能自动切换(副本集可以) 环境:(在一个服 ...

HTMLのフォームの送信ボタンは、inputとbuttonでは機能的な違いがありますか？

(X)HTMLのフォームの送信ボタンは.inputとbuttonでは機能的な違いがありますか? <input type="submit" value="送信&quo ...

Android -- Layout布局文件里的android:layout_height等属性为什么会不起作用？

有的时候,我们配置好的布局文件,在加载完成添加到我们的Activity中后发现,并没有安装我们设置的属性来布局,比如我们设置了android:layout_marginTop="100dip ...

CodeIgnitor 创建admin和其他目录，前后端分离，很巧妙的方式，网上查找其他的都不是使用这种方式实现的。

在index.php的第97和98行的注释, // The directory name, relative to the "controllers" folder. Leave ...

[_tableView registerNib:[UINib nibWithNibName:@"cellTabell" bundle:nil] forCellReuseIdent ...

iptables防火墙的使用

一.了解防火墙1.防火墙分为硬件和软件,硬件防火墙ASA,软件防火墙iptables(linux)如ISA(windows).2.linux的防火墙分为netfilter(内核模块).iptables ...

转：FIFO的定义与作用

一.先入先出队列(First Input First Output,FIFO)这是一种传统的按序执行方法,先进入的指令先完成并引退,跟着才执行第二条指令. 1．什么是FIFO? FIFO是英文Firs ...

Logistic Regression逻辑回归

参考自: http://blog.sina.com.cn/s/blog_74cf26810100ypzf.html http://blog.sina.com.cn/s/blog_64ecfc2f010 ...

点到多边形的最短距离团队的成果

Cacti是一套基于PHP,MySQL,SNMP及RRDTool开发的网络流量监测图形分析工具.Cacti是通过 snmpget来获取数据,使用 RRDtool绘画图形,而且你完全可以不需要了解RRD ...

设置grep高亮显示匹配项

linux系统管理员使用频率最高的命令之一应该就是 grep吧:如何让查找出来的内容更直观的打印出来呢,常用方法有两种: 方法1:设置别名编辑vim~/.bashrc 添加如下一行内容: alias ...

asd的甩锅计划

asd的甩锅计划时间限制: 1 Sec 内存限制: 128 MB提交: 177 解决: 19[提交][状态] 题目描述大家对hdu上面的畅通工程系列一定很熟悉了吧.比如如下一段,就是畅通工程里 ...

专题

随机推荐

© 2025 憋错料 | info#biecuoliao.com | 10 q. 0.019 s.