字符编码+文件处理

1,什么是字符编码?

字符编码表:人类的字符<--------->数字

ASCII码表:只能识别英文字符

用八个二进制位表示一个英文字符,1个英文字符=8bit

2,为何用字符编码

因为计算机无法识别人类的字符,人类与计算机打交道都是用人类的字符,而计算机无法识别人类的字符只能识别二进制,所以必须为人类的字符编码成计算机能识别的二进制数字

GBK:能识别汉字与英文

1个汉字=2个字节(bytes)=16个bit

1个英文字符=一个字节8bit

一个字节即1bytes=8个二进制位=8bit

Unicode:能识别万国字符,一个字符用两个字节即十六个bit

特点:能识别万国语言

与各个国家的字符编码都有映射关系

utf-8:一个bytes表示英文,三个bytes表示一个汉字

utf-8是Unicode的转换格式

重点:

编码:字符---------->编码---------->unicode的二进制---------->编码---------->GBK的二进制

解码:GBK的二进制---------->解码---------->unicode的二进制---------->解码---------->字符

原文地址:https://www.cnblogs.com/zhangrenguo/p/9674635.html

时间: 2024-08-29 06:35:48

字符编码+文件处理的相关文章

python字符编码文件

字符编码发展 ASCII 255   只支持英文字母和数字,特殊字符   1bytes Unicode     中文和英文               统一2bytes utf-8      中文>3bytes  英文>1bytes bytes类型 文本数据总是unicode由str类型表示,二进制数据则由bytes类型表示 二进制数据用在视频,音频文件以及发送socket网络传输数据等 字符串转成二进制  str.encode("encoding=utf-8") 二进制转

python开发基础:字符编码&amp;文件操作

一,字符编码 1 以什么编码存的就要以什么编码取出 ps:内存固定使用unicode编码, 我们可以控制的编码是往硬盘存放或者基于网络传输选择编码 2 数据是最先产生于内存中,是unicode格式,要想传输需要转成bytes格式#unicode----->encode(utf-8)------>bytes拿到bytes,就可以往文件内存放或者基于网络传输#bytes------>decode(gbk)------->unicode 3 python3中字符串被识别成unicode

Python基础day-5[字符编码,文件处理,函数]

字符编码: 为什么要有字符编码?字符编码是为了让计算机能识别我们人写的字符,因为计算机只认识高低电平,也就是二进制数"0","1". 字符编码其实就是在完成一件,字符====>数字的翻译过程. ASCII: 最早计算机是美国发明的,所以最早诞生的ASCII码也是基于英文考虑的.ASCII码:一个Bytes代表一个字符,1Bytes=bit.最早的ASCII只用到后七位. 127个数字,已经完全能代表键盘了,后来又把127号之后的空位来表示新的字母.符号,还加入

数据类型,字符编码,文件处理

1.数据类型: 数字(整型,长整型,浮点型,复数) 字符串:在介绍字符编码时介绍字节bytes类型 列表 元祖 字典 集合 2.整型 int 作用:年级/等级/身份证号等整型数字相关 定义: age=10 本质上age=int(10) 十进制转成...进制 print(bin(13)) #将整型转变成二进制 print(oct(13)) #将整型转变成八进制 print(hex(13)) #将整型转变成十六进制 常用操作+内置方法 # 存一个值 # 不可变 # x=10 # print(id(x

python数据类型 字符编码 文件处理

一.数据类型种类 字符串 数字(整型.浮点型.长整型.复数) 列表 字典 元组 集合 二.各种类型数据介绍 1.数字 整型 int 作用:用来表示整数类型的数据 浮点型 float 作用:用来表示小数类型的数据 长整型 只有python2中有长整型的概念,python3中没有 复数 >>> x=1-2j >>> x.real 1.0 >>> x.imag -2.0 2.字符串 作用:表示字符类型的数据 定义:在单引号\双引号\三引号内,由一串字符组成

python基础之字符编码及文件操作

一.了解字符编码前的知识储备 1.计算机运行程序或读取文件的原理 为了使计算机运行速度不被I/O操作速度拖慢,CPU并不会直接从硬盘中读取数据,因为硬盘的读写速度和CPU相差太大,所以CPU都是从速度相对较快的内存中读取数据的.而程序文件和文本文件为了永久保存又都保存在硬盘中,因此计算机运行程序或读取文件的过程一般是这样的,先由操作系统控制硬盘将程序文件或文本文件读取到内存中,然后CPU再从内存中读取数据运行或者输出到终端打印到屏幕上. 2.文本编辑器读取文件原理 2.1文本编辑器程序文件读取到

字符编码、文件操作、函数定义

一.字符编码 字符串是一种数据类型,但是,字符串比较特殊的是还有一个编码问题. 因为计算机只能处理数字,如果要处理文本,就必须先把文本转换为数字才能处理.最早的计算机在设计时采用8个比特(bit)作为一个字节(byte),所以,一个字节能表示的最大的整数就是255(二进制11111111=十进制255),如果要表示更大的整数,就必须用更多的字节.比如两个字节可以表示的最大整数是65535,4个字节可以表示的最大整数是4294967295. 由于计算机是美国人发明的,因此,最早只有127个字符被编

python基础(三)----字符编码以及文件处理

字符编码与文件处理 一.字符编码 由字符翻译成二进制数字的过程 字符--------(翻译过程)------->数字 这个过程实际就是一个字符如何对应一个特定数字的标准,这个标准称之为字符编码. 字符编码的发展史 阶段一:现代计算机起源于美国,最早诞生也是基于英文考虑的ASCII ASCII:一个Bytes代表一个字符(英文字符/键盘上的所有其他字符),1Bytes=8bit,8bit可以表示0-2**8-1种变化,即可以表示256个字符 ASCII最初只用了后七位,127个数字,已经完全能够代

列表/元组/字符串/字典/集合/文件/字符编码

1. 列表.元组操作 列表是我们最以后最常用的数据类型之一,通过列表可以对数据实现最方便的存储.修改等操作 定义列表 1 names = ['Alex',"Tenglan",'Eric'] 通过下标访问列表中的元素,下标从0开始计数 1 2 3 4 5 6 7 8 >>> names[0] 'Alex' >>> names[2] 'Eric' >>> names[-1] 'Eric' >>> names[-2] #