字符编码ascii、unicode、utf-8、gbk 的关系

ASCII码：

计算机是美国人发明和最早使用的，他们为了解决计算机处理字符串的问题，就将数字字母和一些常用的符号做成了一套编码，这个编码就是ASCII码。ASC码II包括数字大小写字母和常用符号，一共128个，1字节(Byte)=8bit，8bit能表示的最大数是256，所以ASIIC编码中一个字符的大小就是1Byte

Unicode编码：

计算机进入中国后，ASCII完全不够用，于是我们就制定了自己的GB2312编码，把汉字编码了进去。类似的在各国都有相同的情况，各国都开始制定自己的一套编码，计算机的编码越来越庞大，越来越乱，为了解决这一问题，Unicode应运而生。Unicode将各国文字统一编码，所以Unicode编码可以看做是ASCII的扩展。特点：速度快，但是占内存大。

UTF-8：

UTF-8编码可以理解成Unicode编码的一种升级，为了节省存储空间。UTF-8根据实际使用情况调节存储编码的位数，将所有的字符和符号进行分类：ASCII码中的内容用1个字节保存、欧洲的字符用2个字节保存，东亚的字符用3个字节保存等等

GBK：

GBK也是基于Unicode编码的进一步优化，GBK的文字编码是用双字节来表示的，即不论中、英文字符均使用双字节来表示。

注：

cmd终端默认GBK

unicode utf8 gbk（针对中文）

utf8: 3,用3个字节表示中文

gbk : 2,用2个字节表示中文

原文地址：https://www.cnblogs.com/wupiao/p/11296150.html

时间： 2024-12-31 00:34:40

字符编码ascii、unicode、utf-8、gbk 的关系的相关文章

PHP字符编码ASCII 、GB2312、GBK、UTF-8解释

变量命名规则:1. 变量名区分大小写(case-sensitive) .2. 必须字母或下划线开头.变量名可由字母.数字.下划线组成. 看到这里可能,很多人纳闷了~.那为啥 $我是变量这样的中文也能做变量名呢? 在PHP里,中文的确是可以做变量名的(能用是能用但千万别项目上用....) . 因为这里的字母是指: a-z A-Z 和扩展ASCII 字符里从 127 到 255 ,16进制表示为:0x7f-0xff . 那意思就是ASCII字符里从127到255

字符编码ASCII, Unicode和UTF-8

字符编码是计算机技术的基石,想要熟练使用计算机,就必须懂得一点字符编码的知识. 1. ASCII码我们知道,在计算机内部,所有的信息最终都表示为一个二进制的字符串.每一个二进制位(bit)有0和1两种状态,因此八个二进制位就可以组合出256种状态,这被称为一个字节(byte).也就是说,一个字节一共可以用来表示256种不同的状态,每一个状态对应一个符号,就是256个符号,从0000000到11111111. 上个世纪60年代,美国制定了一套字符编码,对英语字符与二进制位之间的关系,做了统一规定

彻底搞清楚字符编码: ASCII, ISO_8859, GB2312,UCS, Unicode, Utf-8

彻底搞清楚字符编码: ASCII, ISO_8859, GB2312,UCS, Unicode, U 1.ASCII: 0-127(128-255未使用),美国标准 2.IS0-8859-1(latin-1): 0-255, 西欧国家等 3.GB2312:常用简体中文,双字节编码,国标,对于ASCII字符仍采用单字节编码 4.GBK: GB2312的超集,包含繁体,日韩,双字节编码,不是国标(新的国标GB18030-2000是GBK的超集) 5.BIG5:繁体中文,台湾,类似GB2312 6.S

文字编码ASCII，GB2312，GBK，GB18030，UNICODE，UCS，UTF的解析

众所周知,一个文字从输入到显示到存储是有一个固定过程的,其过程为:输入码(根据输入法不同而不同)→机内码(根据语言环境不同而不同,不同的系统语言编码也不一样)→字型码(根据不同的字体而不同)→存储码(根据保存的编码类型不同而不同).不同的存储码之间又有什么异同呢? 一.ASCII系列编码首先来说明ASCII码(American Standard Code for Information Interchange,美国标准信息交换码),这个编码的时代就久远了,是由美国国家标准局(ANSI)制定,目

字符编码ascii、unicode、utf-‐8、gbk 的关系

ASIIC码: 计算机是美国人发明和最早使用的,他们为了解决计算机处理字符串的问题,就将数字字母和一些常用的符号做成了一套编码,这个编码就是ASIIC码.ASIIC码包括数字大小写字母和常用符号,一共128个,1字节(byte)=8bit,8bit能表示的最大数是256,所以ASIIC编码中一个字符的大小就是1个字节 Unicode编码: 计算机进入中国后,ASIIC完全不够用,于是我们就制定了自己的GB2312编码,把汉字编码了进去.类似的在各国都有相同的情况,各国都开始制定自己的一套编码,计

java中的常用字符编码ASCII、Unicode和UTF-8

首先讲一下几种字符的编码方式: 1. ASCII码我们知道,在计算机内部,所有的信息最终都表示为一个二进制的字符串.每一个二进制位(bit)有0和1两种状态,因此八个二进制位就可以组合出256种状态,这被称为一个字节(byte).也就是说,一个字节一共可以用来表示256种不同的状态,每一个状态对应一个符号,就是256个符号,从0000000到11111111. 上个世纪60年代,美国制定了一套字符编码,对英语字符与二进制位之间的关系,做了统一规定.这被称为ASCII码,一直沿用至今. ASCI

字符编码ASCII，Unicode和UTF-8

http://blog.csdn.net/pipisorry/article/details/42387045 ASCII码 ASCII码一共规定了128个字符的编码,比如空格"SPACE"是32(二进制00100000),大写的字母A是65(二进制01000001).这128个符号(包括32个不能打印出来的控制符号),只占用了一个字节的后面7位,最前面的1位统一规定为0. 非ASCII编码英语用128个符号编码就够了,但是用来表示其他语言,128个符号是不够的.比如,在法语中,字母

字符编码 ASCII，Unicode 和 UTF-8 概念扫盲

今天中午,我突然想搞清楚Unicode和UTF-8之间的关系,于是就开始在网上查资料. 结果,这个问题比我想象的复杂,从午饭后一直看到晚上9点,才算初步搞清楚. 下面就是我的笔记,主要用来整理自己的思路.但是,我尽量试图写得通俗易懂,希望能对其他朋友有用.毕竟,字符编码是计算机技术的基石,想要熟练使用计算机,就必须懂得一点字符编码的知识. 1. ASCII码我们知道,在计算机内部,所有的信息最终都表示为一个二进制的字符串.每一个二进制位(bit)有0和1两种状态,因此八个二进制位就可以组合出2

字符编码 ASCII，Unicode 和 UTF-8扫盲

今天中午,我突然想搞清楚Unicode和UTF-8之间的关系,于是就开始在网上查资料. 结果,这个问题比我想象的复杂,从午饭后一直看到晚上9点,才算初步搞清楚. 下面就是我的笔记,主要用来整理自己的思路.但是,我尽量试图写得通俗易懂,希望能对其他朋友有用.毕竟,字符编码是计算机技术的基石,想要熟练使用计算机,就必须懂得一点字符编码的知识. 1. ASCII码我们知道,在计算机内部,所有的信息最终都表示为一个二进制的字符串.每一个二进制位(bit)有0和1两种状态,因此八个二进制位就可以组合出2

猜你喜欢

46、求1+2+3+...+n，要求不能使用乘除法、for、while、if、else、switch、case等关键字及条件判断语句（A?B:C）。

思路:循环或者递归都有个结束条件和执行条件.用&&短路与代替. //短路与&&:就是只有前一个条件满足才可以去判断第二个条件. //递归的出口就是n=0时,当n> ...

数据库之SQL语法

-- 创建数据库CREATE DATABASE mytest; -- 创建表CREATE TABLE t_user( -- primary key 定义该列为主键列 -- AUTO_INCREMENT ...

adobe media encoder cc 2015在win10中打开崩溃的解决办法（该方法同样适用于adobe其他产品）

今天就给大家讲讲adobe media encoder cc 2015启动的时候崩溃的问题,先来看看现象.就是这样了,然后我在网上找了很多办法,有的方法已经过时了,也或者因为现在新版本的adobe m ...

LintCode: Binary Tree Postorder Traversal

C++,递归 1 /** 2 * Definition of TreeNode: 3 * class TreeNode { 4 * public: 5 * int val; 6 * TreeNode ...

为什么我们使用192.168.0.1作为内网ip

私有IP地址是一段保留的IP地址.只是使用在局域网中,在Internet上是不使用的. 私有IP地址的范围有: 10.0.0.0-10.255.255.255 172.16.0.0—172.31.25 ...

UX&UI的介绍区别

在Web设计的世界中,一直充斥着各种诸如UX.UI这样的专业名词.然而他们到底是什么意思呢? 在传递一个非凡的网站使用体验给终端用户的过程中,UX(User Experience 用户体验)设计和UI ...

ADO.NET笔记——存储二进制大对象（BLOB）

相关知识上传二进制大对象(Binary Large Object)(如图片.视频等)的基本编程步骤是: 在数据库中使用varbinary(MAX).varchar(MAX)或者nvarchar(MA ...

margin 碰到过的重叠问题

双倍margin 稍微记录一下,因为常忘 float + margin,实际边距会变成设置值的双倍. 解决办法是将元素设为 display:inline 最好要了解 IE的 haslayout 问题 ...

【MYSQL】update/delete/select语句中的子查询

update或delete语句里含有子查询时,子查询里的表不能在update或是delete语句中,如含有运行时会报错:但select语句里含有子查询时,子查询里的表可以在select语句中. 如:把 ...

Gradle Goodness: Rename Ant Task Names When Importing Ant Build File

Migrating from Ant to Gradle is very easy with the importBuild method from AntBuilder. We only have ...

PHP安装、配置及拓展

主要总结的是PHP的安装.配置.拓展库的添加及验证,实现平台为Unix/Linux/Mac OS X,这里也包括日后的技术文章,只将PHP语言作为服务器端脚本和命令式脚本的使用进行总结,其中不涉及 ...

数据库的本质、概念及其应用实践（二）

原文请详见:http://www.ucai.cn/blogdetail/7034?mid=1 能够在线执行查看效果哦! 三.各种数据库的关系.实践 3.1.自制简单文本格式(甚至在PHP中,用数据保存 ...

angular.js的依赖注入解析

本教程使用AngularJS版本:1.5.3 angularjs GitHub: https://github.com/angular/angular.js/ Angula ...

number类型精度分析

numbe类型的可设置的取值范围: number无限定 number(6)是6位整数 number(6,2)是4位整数,精确到两位小数,最多6位.四舍五入 number(6,-2)是6位整数,精确到百 ...

搞懂树状数组（转）

ps:转的,这篇写的不错. 写下这个标题,其实心里还是没底的,与其说是写博帖,不如说是做总结.第一个接触树状数组还是两年前,用什么语言来形容当时的感觉呢?……太神奇了!真的,无法表达出那种感觉,她是那 ...

Hadoop虽然强大，但不是万能的(CSDN)

Hadoop很强大,但企业在使用Hadoop或者大数据之前,首先要明确自己的目标,再确定是否选对了工具,毕竟Hadoop不是万能的!本文中列举了几种不适合使用Hadoop的场景. 随着 Hadoop ...

NuGet学习笔记(1) 初识NuGet及快速安装使用

关于NuGet园子里已经有不少介绍及使用经验,本文仅作为自己研究学习NuGet一个记录. 初次认识NuGet是在去年把项目升级为MVC3的时候,当时看到工具菜单多一项Library Package M ...

<a>实现按钮的javascript+jquery编程实例

涉及知识点:怎样实现让注册的function获取当前<a>,以便通过它进行其他操作风格一: 1.html端: <td class="text-center"&g ...

ORDER BY RAND()

大概是因为需要研究了一下MYSQL随机样本实现.例如:离tablename表随机抽取了创纪录,我们一般的写法是:SELECT * FROM tablename ORDER BY RAND() LIMI ...

iframe宽高百分百显示

<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/ ...

专题

随机推荐

© 2025 憋错料 | info#biecuoliao.com | 10 q. 0.021 s.