Python 之字符转编码操作

字符转编码操作

# -*- coding:utf-8 -*-
import sys
print(sys.getdefaultencoding())

s = "你好"

python2写法，将s转换成"gbk"

s_to_gbk = s.decode("utf-8").encode("gbk")

#1.在Python2下，所有字符编码为"ascii"
#2.当文件头声明定义为：utf-8
#3.将s转换gbk，首先将s解码成utf-8: s.decode("utf-8")，utf-8其实就是unicode的扩展，所以后面可直接编码。
#4.将s从utf-8编码成gbk,s.decode("utf-8").encode("gbk")

Python3写法,将s转换成“gbk"

s_to_gbk = s.encode("gbk")

#1.在Python3下，所有字符编码为"utf-8"（unicode）
#2.将s解码成gbk, s.encode("gbk")

#备注：Python2 与 Python3 区别：
#1. Python2 的字符默认为ASCII , Python3 的字符默认为utf-8(unicode)
#2. 因所有字符编码之间的转换都需要经过unicode，所以python2 比python3 多了一个步骤。

原文地址：http://blog.51cto.com/12965094/2345717

时间： 2024-10-13 11:09:25

Python 之字符转编码操作的相关文章

Python基础【day03】：字符转编码操作

一.概述说到python的编码,一句话总结,说多了都是泪啊,这个在以后的python的开发中绝对是一件令人头疼的事情.所以有必要要讲讲清楚二.编码介绍 1.须知: 在python 2中默认编码是 ASCII,而在python 3中默认编码是 unicode unicode 分为utf-32 (占4个字节),utf-16(占两个字节),utf-8(占1-4个字节),所以utf-16 是最常用的unicode版本,但是在文件里存的还是utf-8,因为utf8省空间在python 3,encod

Python 基础 - Day 2 Learning Note - 字符转编码操作

前情提要:字符编码 python解释器在加载 .py 文件中的代码时,会对内容进行编码(默认ascill).ASCILL有255个字符,包括英语和西欧字符,不包括中文.汉字处理靠GBK, window的中文内码.Unicode(统一码.万国码.单一码)是一种在计算机上使用的字符编码.Unicode 是为了解决传统的字符编码方案的局限而产生的,它为每种语言中的每个字符设定了统一并且唯一的二进制编码,规定虽有的字符和符号最少由 16 位来表示(2个字节),即:2 **16 = 65536,(注:此处

Python中字符的编码与解码

1 文本和字节序列我们都知道字符串,就是由一些字符组成的序列构成串,那么字符又是什么呢?计算机只能识别二进制的东西,那么计算机又为什么会显示我们的汉字,或者是某个字母呢? 由于最早发明使用计算机是美国人,他们为了解决了英语如何在电脑上显示,就制定了一套标准:ASCII ((American Standard Code for Information Interchange): 美国信息交换标准代码),主要用于显示现代英语和其他西欧语言.到目前为止共定义了128个字符,从0-127的二进制数分别

python学习-字符和编码

一.ASCII.Unicode.UTF-8的由来和关系 1.由来:因为计算机只识别数字,所以计算机的发明国家美国对大小写英文字母.数字以及一些特殊符号进行了编码,共127个,即ASCII编码表. 2.发展:因为ASCII编码不支持中文,所以中国制定了GB1312编码,韩国制定了Euc-kr.日本制定了Shift-JIS... 3.整合:世界上有上百种语言,使用各自的编码最终的结果就是乱码.因此Unicode编码出现了,Unicode支持所有的语言.也是计算机使用的编码. 4.优化:Unicode

Python：字符编码详解

相关文章 Python中文编码问题:为何在控制台下输出中文会乱码及其原理 1. 字符编码简介 1.1. ASCII ASCII(American Standard Code for Information Interchange),是一种单字节的编码.计算机世界里一开始只有英文,而单字节可以表示256个不同的字符,可以表示所有的英文字符和许多的控制符号.不过ASCII只用到了其中的一半(\x80以下),这也是MBCS得以实现的基础. 1.2. MBCS 然而计算机世界里很快就有了其他语言,单字节

python 处理字符编码问题

今天好不容易重新开始写Python做实验,结果被字符编码虐的体无完肤.其实之前就已经比较清楚python处理字符编码的套路,但是今天白天反复的出现can't encode/decode ..., the original code not in 178之类的提示,甚是无力,后来偶尔使用了一下sys.setdefaultencoding('utf8')就解决了全部问题,真是不解. 下面还是总结一下Python几个编码设置的含义吧. 1. #coding=utf8 这种形式的注释告诉解释器,应该以c

Python常见字符编码间的转换

学习Python,字符编码间的转换是绕不过去的一只拦路虎,不把编码彻底搞明白,总有一天它会猝不及防坑你一把. Python2.x和Python3.x在字符编码的设置上也有很大区别(Python3未来将是主流,所以Python3为主),今天我们就来一起学习下. 上一篇文章里我已经简述了Python的常见编码了,这里就不再赘述了,还不清楚的小伙伴可以先去看下: http://www.cnblogs.com/schut/p/8406897.html 一.Unicode 和 UTF-8的纠葛 U

二进制转换、字符编码的演化、Python里使用的编码、浮点数、浮点数的精确度问题

二进制转换二进制是计算技术中广泛采用的一种数制.二进制数据是用0和1两个数码来表示的数.它的基数为2,进位规则是"逢二进一",借位规则是"借一当二",由18世纪德国数理哲学大师莱布尼兹发现.当前的计算机系统使用的基本上是二进制系统,数据在计算机中主要是以补码的形式存储的.计算机中的二进制则是一个非常微小的开关,用"开"来表示1,"关"来表示0. 古时候敌人来了,如何通信呢? ①派人跑着去通知,速度太慢,等人回来,仗也打完了.

python 之字符串和编码

字符编码我们已经讲过了,字符串也是一种数据类型,但是,字符串比较特殊的是还有一个编码问题. 因为计算机只能处理数字,如果要处理文本,就必须先把文本转换为数字才能处理.最早的计算机在设计时采用8个比特(bit)作为一个字节(byte),所以,一个字节能表示的最大的整数就是255(二进制11111111=十进制255),如果要表示更大的整数,就必须用更多的字节.比如两个字节可以表示的最大整数是65535,4个字节可以表示的最大整数是4294967295. 由于计算机是美国人发明的,因此,最早只有1

猜你喜欢

使用Arduino开发板制作交流电压表

在本文中,我们将使用Arduino开发板制作一个交流电压测量装置,测量我们家中交流电源的电压.我们将在Arduino IDE的串行监视器上打印输出该电压,并在万用表上显示出来. 制作数字电压表比模拟电 ...

Python3.x和Python2.x的区别

%5BjavaSE%5D%20%E6%95%B0%E6%8D%AE%E7%BB%93%E6%9E%84%E4%BA%8C%E5%8F%89%E6%9F%A5%E6%89%BE%E6%A0%91-%E6 ...

数组指针的反思

每次想用指针来代替数组,有一种强迫症就是,假如元素个数变化,用数组就不方便,但是每次用指针代替数组都会犯各种各样的错误: 首先,指针肯定要初始化一个地址的,初始化一个地址有两种方法,第一种就是用new ...

Java泛型小记

Automobile类: public class Automobile { private String name; public Automobile(String name){ this.nam ...

Android之路-------浅淡Android历史、系统架构与开发特色

前言离上一篇发表的博客差不多有两个星期了吧,相信有些博友差点就对LP失望了,因为上一篇博文中说了,这次不管怎样,LP都会坚持写博客的. 由于工作关系LP才隔了这么久才再次发表博文,这篇博文主要是总结 ...

ant中提取properties和xml提高代码复用性

本文接着上文对前面的示例进行优化,在前面的build.xml中,有些代码是重复的,我们可以将其抽象出来拿来共同使用,比如将一些路劲提取出来放入properties,可以达到共用的同时,还可以增强程序的 ...

初始Hibernate框架技术

hibernate: 定义:ORM:Object Relational Mapping 对象关系映射使用hibernate时几个必要的: 1.实体类 2.映射文件(类 -数据库表,属性-字段) ...

pqmagic 11.0中文版下载

pqmagic 11.0中文版是pq系列最新版本的硬盘分区工具,支持win7.win8操作系统,小编经常使用pqmagic对硬盘分区容量进行调整,同时pqmagic 还具有移动.隐藏.合并.删除.格式 ...

Java 线程池 +生产者消费者+MySQL读取300 万条数据

1.1需求数据库300 万条用户数据 ,遍历获取所有用户, 各种组合关联, 获取到一个新的json ,存到redis 上. 1.2 难点数据库比较多, 不可能单线程查询所有的数据到内存. 1.3解 ...

使用id名称和name直接获取元素

我们知道一些第三方的js库对如何快速选取html中的元素做了一些简化,貌似十分高深莫测,其实也不然.而且js本身自带了对于特殊元素的简便选取的方法,下面就为大家简单介绍下. 在html中,一般最直接的 ...

[java]用md5来判断两个文件是否完全相同

1.前言由于相比较两张图片是否是相同,如果通过像素点比较感觉速度比较慢,当很多图片进行比较时,效率就低很多了.由于每个文件md5基本上是唯一的,所用用获取文件的md5来判断是否相同文件. 2.代码如 ...

第一个微信小程序（实现点击一个按钮弹出toast）

今天根据网上的教程搭建了微信小程序的环境,然后看文档做了一个简单的小应用. 项目的目录是这个样子的: app.js.app.json.app.wxss是全局文件,必不可少的文件.定义在app.wxss ...

深入探讨ES6生成器

如果对于ES6生成器不熟悉,请先阅读并运行下http://www.cnblogs.com/linda586586/p/4282359.html里面的代码.当你感觉掌握了基础之后,我们可以深入探讨一些细 ...

Java 语法索引 ----- 常量(Constants)

通过关键字Final我们可以使变量成为常量.这意味着无法再给这个变量赋值,不然编译器就会报错. class MyClass { final double E = 2.72; // run-time c ...

Sql多条件排序

多条件排序可以通过在order by语句后面使用case when then条件语句来实现. select * from 表名 ORDER BY case when 条件 then 0 else 1 ...

哪里有七氟烷买

哪里有七氟烷买[加-Q1065427042电-话151-68344817元吉药业]专业的品质,强劲的效果,回头客信赖.http://11839742.blog.51cto.com/11829742/1 ...

com.caucho.hessian.io.HessianProtocolException: expected string at 0x6d

1. 现象在学习Hessian时,A系统通过hessian去调用B,但收到500错误: java.io.IOException: Server returned HTTP response code ...

HAWQ与Hive查询性能对比测试

一.实验目的本实验通过模拟一个典型的应用场景和实际数据量,测试并对比HAWQ内部表.外部表与Hive的查询性能. 二.硬件环境 1. 四台VMware虚机组成的Hadoop集群.2. 每台机器配置如 ...

Resolving SQL Server Disk IO bottlenecks

网上看到这篇文章挺不错的,直接翻译过来.在尝试诊断SQL Server性能时,不要仅仅依赖某个单一的诊断数据,比如CPU的使用率.SQL Server磁盘性能,就得出结论却忽略的问题的根源.实际上,使 ...

Android ListView 滚动的N种方法

Android 里面让ListView滚动有N种方法,这儿列举三种: 我的需求是通过按键让Listview滚动起来,当然这些按键不是通过Android标识接口传输过来的,所以不能通过监听按键事件来实现 ...

专题

随机推荐

© 2024 憋错料 | info#biecuoliao.com | 10 q. 0.023 s.