python中的字符串编码问题——3.各操作系统下的不同编码方式

各操作系统下的不同编码方式

先看一下
linux,python2.7
>>> B = b‘\xc3\x84\xc3\xa8‘
>>> B.decode(‘utf-8‘)
u‘\xc4\xe8‘
>>> type(B)
<type ‘str‘>
>>>

windows,python2.7,python shell
>>> B = b‘\xc3\x84\xc3\xa8‘
>>> B.decode(‘utf-8‘)
u‘\xc4\xe8‘
>>> print B.decode(‘utf-8‘)
?è
>>>

windows,python2.7,python cmd控制台
>>> B = b‘\xc3\x84\xc3\xa8‘
>>> B.decode(‘utf-8‘)
u‘\xc4\xe8‘
>>> print B.decode(‘utf-8‘)
Traceback (most recent call last):
File "<stdin>", line 1, in <module>
UnicodeEncodeError: ‘gbk‘ codec can‘t encode character u‘\xc4‘ in position 0: il
legal multibyte sequence
>>>

三种环境下不同输出的原因：

windows控制台默认采用GBK编码，liunx默认采用UTF-8编码
------------------------------------------------------
查看linux默认编码：
[[email protected] ~]# env |grep LANG
LANG=zh_CN.UTF-8
------------------------------------------------------
查看windows控制台默认编码：
cmd打开控制台---->属性---->查看编码为936（简体中文GBK）
（进一步在linux和windows下新建文本文件查看编码方式果然没错，证实。）

原文地址：https://www.cnblogs.com/Micang/p/9733028.html

时间： 2024-11-10 11:54:16

python中的字符串编码问题——3.各操作系统下的不同编码方式的相关文章

Python中Unicode字符串

Python中Unicode字符串字符串还有一个编码问题. 因为计算机只能处理数字,如果要处理文本,就必须先把文本转换为数字才能处理.最早的计算机在设计时采用8个比特(bit)作为一个字节(byte),所以,一个字节能表示的最大的整数就是255(二进制11111111=十进制255),0 - 255被用来表示大小写英文字母.数字和一些符号,这个编码表被称为ASCII编码,比如大写字母 A 的编码是65,小写字母 z 的编码是122. 如果要表示中文,显然一个字节是不够的,至少需要两个字节,而且

零基础学python-7.1 python中的字符串简介与常用函数

在python中,字符串变成了一个强大的处理工具集,他是不可变的,也就是说字符串包含字符与字符的顺序,他不可以原处修改字符串是我们后面需要学习的稍大一点的对象类别--序列的第一个代表在字符串章节所说到的关于序列的操作,后面的列表与元组一样适用字符串常用的一些操作与函数操作解释 s='' 空字符串 s="abc'd" 双引号和单引号相同 s='abc\n' 转义序列,使用变量完全显示字符, 只有使用print函数才能够显示转义 s="""aaaaa

Python中的字符串处理

Python转义字符在需要在字符中使用特殊字符时,python用反斜杠(\)转义字符.如下表: 转义字符描述 \(在行尾时) 续行符 \\ 反斜杠符号 \' 单引号 \" 双引号 \a 响铃 \b 退格(Backspace) \e 转义 \000 空 \n 换行 \v 纵向制表符 \t 横向制表符 \r 回车 \f 换页 \oyy 八进制数yy代表的字符,例如:\o12代表换行 \xyy 十进制数yy代表的字符,例如:\x0a代表换行 \other 其它的字符以普通格式输出 Python字符

Python中的字符串

在Python中,字符串的类型可以归为三类:str,bytes,bytearray,其中str和bytes是不可变类型,而bytearray是可变类型.由于Python 2.X和Python 3.X的区别,相应的,它们在Python 2.X和Python 3.X中有不同的意义. 在Python 2.X中,str即可以表示8bit的文本(例如ASCII文本,Latin-1文本),也可以表示二进制数据,也就是说,在Python 2.X中,str和bytes类型是等价的:如果要表示Unicode文本,

《python解释器源码剖析》第3章--python中的字符串对象

3.0 序我们知道python中的字符串属于变长对象,当然和int也是一样,底层的结构体实例所维护的数据的长度,在对象没有定义的时候是不知道的.当然如果是python2的话,底层PyIntObject维护的就是一个long,显然在没创建的时候就知道是1. 可变对象维护的数据的长度只能在对象创建的时候才能确定,举个例子,我们只能在创建一个字符串或者列表时,才知道它们所维护的数据的长度,在此之前,我们对此是一无所知的. 注意我们在前面提到过可变对象和不可变对象的区别,在变长对象中,实际上也可以分为

《python源码剖析》笔记 python中的字符串对象

本文为senlie原创,转载请保留此地址:http://blog.csdn.net/zhengsenlie 1. PyStringObject --> 变长不可变对象 typedef struct{ PyObject_VAR_HEAD//ob_size变量保存着对象中维护的可变长度内存的大小 longob_shash; //缓存该对象的hash值,用于dict的查询 intob_sstate; //标志该对象是否经过intern机制的处理 char ob_sval[1];// 字符指针

[笔记] 创建python中的字符串translator

将python中的字符串的某些字符转化为特定字符是经常用到string库中的maketrans()函数,以及translate()函数. 但是这两个函数比较抽象: maketrans函数产生的对象是一个表,这个数据结构对初学者并不友好. tranlate(table, deleteValue)函数所需的第一个参数是个表结构,也就是maketrans的返回值,deleteValue是所要删除的字符.这第二个参数很别扭:一个translate函数,有时候还能删除某些字符. 而且使用过程中,往往两个函

python中修改字符串的值

demo: info = 'abc' 如果要把上面的字符串info里面的c替换成d,要怎么操作呢? 方法一:使用python中的replace()方法语法: str.replace(old, new[, max]) 参数: old -- 将被替换的子字符串. new -- 新字符串,用于替换old子字符串. max -- 可选字符串, 替换不超过 max 次 >>> info = "abc" >>> str = info.replace("

python中分割字符串split切割并选择输出逐行读取文件后字符串拼接

字符串根据分隔符切割后输出,一下面 #!/usr/bin/python # -*- coding: utf-8 -*- str="abc,123 efg,567" #以空行分割后输出 print str.split(); #以','分割2次后输出 print str.split(',',2); #以','分割2次后输出地2个参数,1是从0开始,代表第二个参数 print str.split(',',2)[1]; 输出结果如下: ['abc,123', 'efg,567'] ['abc'

猜你喜欢

UVA11491 奖品的价值

奖品的价值C804 运行时间限制:1000ms: 运行空间限制:51200KB 试题描述你是一个电视节目的获奖嘉宾.主持人在黑板上写出一个 n 位非负整数(不以 0 开头),邀请你删除其中的 d 个 ...

GitHub超详细图文攻略 - Git客户端下载安装 GitHub提交修改源码工作流程 Git分支标签过滤 Git版本工作流（转载）

最近听同事说他都在使用GitHub,GitHub是程序员的社区,在里面可以学到很多书上学不到的东西,所以最近在准备入手这方面的知识去尝试学习,正好碰到这么详细完整的文章,就转载了,希望对自己和大家有帮 ...

python基础学习日志day7-类的反射

1)python中的反射功能是由以下四个内置函数提供:hasattr.getattr.setattr.delattr, 改四个函数分别用于对对象内部执行:检查是否含有某成员.获取成员.设置成员.删除成 ...

NUC970平台触摸屏驱动移植

原理概述 1.首先要区分lcd和触摸屏,lcd是一个屏幕,触摸屏是贴在lcd上的两层膜. 2.四线电阻触摸屏的原理:触摸屏就是上下两层膜,比如上层代表x轴(XM:负端,XP:正端),下层代表y轴(YM ...

2015.10.31

这周我们换了新的校区和老师,新老师的讲课方式和方法和之前的老师有很大的区别.我们也还是能够适应,新老师也讲了一些我们之前没有学习到的知识.对这些没有学习到的知识也没有完全的掌握. 对于刚刚了解到的知识 ...

范甘迪发个电饭锅看少点飞是电饭锅房交会

http://www.shuo6.com/thread-6052928-1-1.html http://www.shuo6.com/thread-6052935-1-1.html http://www ...

这么久不写博客的原因

从13年到14年,这段时间基本上没有在写博客了,原因就是因为有了Evernote,所有的秘籍.学习感悟的东西都记载在里面.时间过得真快,15年已经开始了,evernote固然好用,但是毕竟是属于私人的 ...

CSS的六大选择器

选择器:选择器是一种模式,用于选择需要添加样式的元素. 首先简述六大选择器基本选择器标签选择器类选择器 ID选择器高级选择器层次选择器结构伪类选择器属性选择器其中基本选择器与层次选择器 ...

[读书笔记]Effective Java 第一章

需要了解JAVA最近每个版本新增的特性,并善用这些新特性为自己的程序实现高效简洁的代码. 其中提到的编程原则包括: 模块要尽可能的小代码应该要被重用,而不是被拷贝模块之间的依赖性应该尽可能降到最小 ...

Android USB Host与HID通讯

前端时间捣鼓一个HID的硬件, 需要和android通信, 网上搜索了一圈,收获不小. 比较好的文章是: Android USB Host与HID通讯 Android Service创建US ...

瀑布流代码，简洁版带分页

接上一篇瀑布流代码,简洁版的功能之上添加分页的功能 Index.cshtml @using PagedList.Mvc @model PagedList.StaticPagedList< ...

Mysql储存过程4:mysql变量设置

默认全局变量是两个@@开头, 可用show variables查看所有默认变量: @@user #declare定义变量只能用在储存过程中 #declare 变量名数据类型可选类型 declare ...

TCP/IP之socket编程

socket编程在TCP/IP协议中"IP地址+端口号"就称为socket.首先我们来看看socket API,即TCP/IP协议的应用层编程接口. 我们接下来编写一个简单的客户端 ...

mv:移动或重命名文件.常用参数:-f,缺省. [[email protected] ~]# man mv MV(1) User Commands ...

干货：主流的App推广形式和费用详解

原文地址: http://www.leiphone.com/news/201408/g8UwvbLLea2GKUT2.html 目前国内App开发者正面临推广困境,推广的费用正在进一步提高,(一些推广 ...

事件处理（一）

事件处理步骤: 1.注册事件监听器 2.根据指定的事件中编写事件处理的代码 3.在事件处理的代码证完成对事件的处理事件处理方法 1.setOnClickListener(View.OnClickLi ...

洛谷——P3379 【模板】最近公共祖先（LCA）

https://www.luogu.org/problem/show?pid=3379#sub 题目描述如题,给定一棵有根多叉树,请求出指定两个点直接最近的公共祖先. 输入输出格式输入格式: 第一 ...

poj 1201 Intervals 差分约束系统

题目链接:http://poj.org/problem?id=1201 题意:给定n(1<= n <= 50000)个闭区间,每个区间后面带一个值 Ci, 问集合Z个数的最小值使得在每个 ...

一、CoreAnimation之图层树详解

CoreAnimation :在字面意思为“核心动画”,但是如果您认为它仅仅是一个动画框架,那可能就要错过一些经典功能了.动画,只是CoreAnimation功能的一小部分,毕竟人家的源头是一个叫做L ...

pair的类型: pair 是一种模版类型.每个pair 可以存储两个值.这两种值无限制.也可以将自己写的struct的对象放进去.. pair<string,int> p; pair& ...

专题

随机推荐

© 2024 憋错料 | info#biecuoliao.com | 11 q. 0.026 s.