字符编码的发展与使用

问题1 计算机只能处理数字,若要处理文本就要将文本先转换成数字

结果 ASCII码出现,它的作用就是将文本与数字对应起来,ASCII码以一字节作为单位

问题2 ACSII码只能对应英文大小写,数字和一些符号,其他国家的语言怎么办?

结果 各个国家制定了不同的编码,比如我国的GB2312

问题3 各国的标准不一样,在一起使用时就会冲突,会出现乱码

结果 出现Unicode编码,Unicode将所有语言统一起来,统一到一套编码中,Unicode以两字节为单位

问题4 Unicode虽然方便,但是如果某一个文本基本以英文出现,使用Unicode就会占用没必要的内存,不节约,传输上也不方便

结果 出现UTF-8编码,被称为可变长编码,它根据字符的不同,使用不同长度的字节储存

如此便完美解决字符储存的问题!

下面说一下字符编码在计算机中的工作方式:

总的来说,在内存中使用UTF-8编码,在使用时(比如一个记事本在编辑文本)转换为Unicode编码

浏览网页时,在服务器中为Unicode编码,在传输时为UTF-8编码

时间: 2024-11-05 19:27:53

字符编码的发展与使用的相关文章

字符编码的发展历程

阶段1: 计算机只认识数字,我们在计算机里一切数据都是以数字来表示,因为英文符号有限 所以在规定使用的字节的最高位是0,每一个字节都是以0~127之间的数字来表示,比如A对应65,a对应97. 这就是美国标准信息交换码-ASCLL. 阶段2: 随着计算机在全球的普及,很多国家和地区都把自己的字符引入了计算机,比如汉字. 此时发现一个字节能表示数字范围太小,不能包含所有的中文汉字,那么就规定使用两个字节来表示一个汉字. 规定:原有的ASCLL字符的编码保持不变仍然使用一个字节表示,为了区别一个中文

第六节,初识python和字符编码

程序语言的发展 机器语言 程序语言,最初的计算机语言是机器语言,完全是0和1组成的二进制串  如:01010101 11010101 汇编语言 因为01010101的字符串,冗长,不利于维护,所以产生了带助记符的汇编语言 举例:fua = 01010101    fub = 11010101 c语言 在汇编的基础上开发了c语言 有了常量,变量,字符串,等运算规则 java.c#.php.python 在c语言的基础长有发展了java.c#.php.python 等各种语言 这些语言都需要安装运行

python之字符编码

(一)什么是字符编码: 计算机中所有的数据,包括文件,图片,视频,音频等都是以二进制的方式 存储的,计算机只能识别0,1这样的机器语言.而我们想让计算机替我们工作必须能让计算机能够识别我们对它发出的指令,那么就需要一种方式把我们人类的语言翻译成计算机能听懂的语言.这个翻译的过程实际就是一个字符如何对应一个特定数字的标准,这个标准称之为字符编码. (二)字符编码的发展历程: 阶段一,ASSCII码:一个bytes代表一个字符(英文字符以及键盘上其它所有的字符)1bytes=8bit,8bit可以表

Java 字符编码与解码

1.字符编码的发展历程 ①.ASCII 码 因为计算机只认识数字,所以我们在计算机里面的一切数据都是以数字来表示,因为英文字符有限,所以规定使用的字节的最高位是 0,每一个字节都是以 0-127 之间的数字来表示.比如 A 对应 65,a 对应 97.这便是 美国标准信息交换码,ASCII String str = new String("Aa"); byte[] strASCII = str.getBytes("ASCII"); System.out.printl

8 字符编码

学习字符编码的计算机基础储备 1.计算机软件运行基础图解 2.文本编辑器存取文件原理.(nodepad++,pycharm,word) 打开编辑器就打开了一个进程,是在内存中的,所以在编辑器编写的内容也都是存放与内存中的,断电后数据丢失.因而需要保存到硬盘上,点击保存按钮,就从内存中把数据刷到了硬盘上. 在这一点上,我们编写一个py文件(没有执行),跟编写其他文件没有任何区别,都只是在编写一堆字符而已. 3. python解释器执行py文件的原理 ,例如python test.py 第一阶段:p

字符编码集格式

Java 字符编码与解码   1.字符编码的发展历程 ①.ASCII 码 因为计算机只认识数字,所以我们在计算机里面的一切数据都是以数字来表示,因为英文字符有限,所以规定使用的字节的最高位是 0,每一个字节都是以 0-127 之间的数字来表示.比如 A 对应 65,a 对应 97.这便是 美国标准信息交换码,ASCII ? 1 2 3 String str = new String("Aa"); byte[] strASCII = str.getBytes("ASCII&qu

字符编码与字符集

我们先弄清几个英文缩写: ASCII(American Standard Code for Information Interchange):美国标准信息交换代码 ISO (International Organization for Standardization):国际标准化组织 UCS(Universal Multiple-Octet Coded Character Set):通用多八位编码字符集,俗称UNICODE UTF(UCS Transformation Format):UNICO

七、字符编码、文件处理

先了解 文本编辑器存取文件原理 打开编辑器就打开了启动了一个进程,是在内存中的,所以,用编辑器编写的内容也都是存放与内存中的,断电后数据丢失 要想永久保存,需要点击保存按钮:编辑器把内存的数据刷到了硬盘上. 在我们编写一个py文件(没有执行),跟编写其他文件没有任何区别,都只是在编写一堆字符而已. python解释器执行py文件原理 一:python解释器启动,此时就相当于启动了一个文本编辑器 二:python解释器相当于文本编辑器,去打开test.py文件,从硬盘上将test.py的文件内容读

Python中的字符串与字符编码

原文地址:点击这里 本节内容: 前言 相关概念 Python中的默认编码 Python2与Python3中对字符串的支持 字符编码转换 一.前言 Python中的字符编码是个老生常谈的话题,同行们都写过很多这方面的文章.有的人云亦云,也有的写得很深入.近日看到某知名培训机构的教学视频中再次谈及此问题,讲解的还是不尽人意,所以才想写这篇文字.一方面,梳理一下相关知识,另一方面,希望给其他人些许帮助. Python2的 默认编码 是ASCII,不能识别中文字符,需要显式指定字符编码:Python3的