python学习之字符编码

字符串涉及到编码:ascii gbk gb2312 unicode uft-8

对于英文字符ASCII(可以看成utf-8的子集)就可以了,中文用gbk/gb2312;

unicode:世界统一的计算机系统编码(内存中),但是存储时比较浪费空间,所以存到硬盘或者输出查看时用uft-8.也就是说用记事本打开读时或浏览网页时都是Unicode-》tuf-8,因为记事本和浏览器服务器系统是Unicode类型的

uft-8:ptthon保存源代码时,就需要务必指定保存为UTF-8编码.在程序开头申明了UTF-8编码并不意味着你的.py文件就是UTF-8编码的,这就要通过文本编辑器的设置-编码类型来设置正在使用UTF-8 without BOM编码。如果.py文件本身使用UTF-8编码,并且也申明了# -*- coding: utf-8 -*-,打开命令提示检验是否支持了中文

Python 3版本中,字符串是以Unicode编码的即支持中文

Python提供了ord(‘字符’)函数获取字符的编码整数表示,chr()函数把编码转换为对应的字符

Python的字符串类型是str,在内存中以Unicode表示,一个字符对应若干个字节,以Unicode表示的str通过.encode(‘ASCII’)方法可以编码为指定的bytes

bytes类型的数据用带b前缀的单引号或双引号表示,用于字符串在网络上传输,或者保存到磁盘上

len(‘ABC‘)与len(b‘ABC‘)分别表示字符和字节的个数。

格式化输出:用内外2两个%

>>> ‘Hi, %s, you have $%d.‘ % (‘Michael‘, 1000000) ‘Hi, Michael, you have $1000000.‘

时间: 2024-11-05 14:59:36

python学习之字符编码的相关文章

Python学习:字符编码及文件处理

本节理论颇多,结论一些,只写重点. 1.字符编码 以什么编码存的就用什么编码取出 PS:内存固定使用unicode编码,我们可以控制的编码是往硬盘存放或者基于网络传输选择的编码. 2.数据是最先产生于内存中,是unicode格式,要想传输(1.网络2.硬盘)需要转成bytes格式 #unicode------>encode(utf-8)--------->bytes 拿到bytes,就可以往文件内存放,或者基于网络传输. #bytes--------->decode(utf-8)----

python学习:字符编码与转码

在Python3中必须先弄清楚的三个问题:1.Python3中默认是Unicode编码.2.gbk --> utf-8.utf-8 --> gbk都要通过Unicode“中转”一下.3.在Python3中,encode后不仅转了编码,还把结果转成了bytes类型.如果要显示中文,再decode一下就可以了. import sys print("Defaultencoding :", sys.getdefaultencoding()) s = '你好' # s是unicode

Python基础day-5[字符编码,文件处理,函数]

字符编码: 为什么要有字符编码?字符编码是为了让计算机能识别我们人写的字符,因为计算机只认识高低电平,也就是二进制数"0","1". 字符编码其实就是在完成一件,字符====>数字的翻译过程. ASCII: 最早计算机是美国发明的,所以最早诞生的ASCII码也是基于英文考虑的.ASCII码:一个Bytes代表一个字符,1Bytes=bit.最早的ASCII只用到后七位. 127个数字,已经完全能代表键盘了,后来又把127号之后的空位来表示新的字母.符号,还加入

Python中的字符编码问题

初学Python,本身就在一些语句处有些迷惑,如 a = u'你好',不知加上这个Unicode参数有何作用.一直到做爬虫抓取新闻时,在cmd的输出上总是出现错误.经过检索相关知识后,对一些编码问题做个小总结,其中参杂个人猜测,难免会有错误,以后再慢慢修改了. 1.一定要声明#coding=XXX吗? 首先.py文件中,编码默认是ASCII的,一旦py文件中出现了中文类似编码,IDE就会提示 也就是提示文中出现了非ASCII,建议在文件开始制定编码,当然我们常用的是#coding:utf8 (貌

Python模块、字符编码、文件读写

模块 当我们用一种语言开始真正的软件开发室,除了编写代码外,还需要很多基本的已经写好的现成的东西,高级语言通常都会为我们提供了一个比较完善的基础代码库,让我们能直接调用,python也不例外,为我们提供了分成完善的基础代码和第三方库.在python中一个.py文件就是一个模块. 模块导入使用import 获取随机数模块 调用系统命令 把执行脚本时传递的参数获取到了 当我们试图加载一个模块时,Python会在指定的路径下搜索对应的.py文件,如果找不到,就会报错,默认情况下,Python解释器会搜

python中的字符编码和转换

1.字符编码初识 最初的字符集是ASCII,ASCII(American Standard Code for Information Interchange,美国标准信息交换代码)是基于拉丁字母的一套电脑编码系统,主要用于显示现代英语和其他西欧语言,其最多只能用 8 位来表示(一个字节),即:2**8 = 256-1,所以,ASCII码最多只能表示 255 个符号. 随着计算机技术的普及和发展,255个符号显然不满足全世界国家对符号数量的需求,因此各国开始发展自己的一套编码.那么针对中文: 为了

Python之Win字符编码详解

Win下的dos窗口输出中文 Python2.7默认字符编码是ascii格式,即使指定字符编码为UTF-8也未必能够输出中文,测试如下: #_*_coding:utf-8_*_# 定义一个变量内容为中文,字符集为UTF-8temp = "中文"# 输出变量temp的内容print(temp) 用win下的dos窗口执行这个脚本,看看输出出来的是否为中文 C:\Users\anshe>python F:\Python_code\sublime\Day02\print.py涓枃  

python基础3 字符编码

本节主要内容: 基本概念 ASCII及其扩展 中文字符编码 unicode 注释 参考网页 基本概念 计算机中储存的信息都是二进制的0/1串,当我们要在计算机中存储诸如英文.中文.标点符号等字符时,需要先把字符转化成二进制的0/1串之后再保存到计算机中:而当我们要读取保存在计算机中的信息时,需要通过一定的方法把里面的二进制0/1串转化成为原先的字符,然后再通过显示器等渠道进行显示. 这里涉及到字符编码的两个基本概念: 字符集(Character Set):指系统支持的所有字符的集合.字符包括涉及

第五篇:python基础之字符编码

1. 计算机基础知识(三幅图) 2. 文本编辑器存取文件的原理(nodepad++,pycharm,word) 打开编辑器就打开了启动了一个进程,是在内存中的,所以在编辑器编写的内容也都是存放与内存中的,断电后数据丢失 因而需要保存到硬盘上,点击保存按钮,就从内存中把数据刷到了硬盘上. 在这一点上,我们编写一个py文件(没有执行),跟编写其他文件没有任何区别,都只是在编写一堆字符而已.  3. python解释器执行py文件的原理 ,例如python test.py 1.第一阶段,python解