编码表的概述和常见编码表

引出编码表:

  我们知道,初学IO的时候使用字节流的read()针对中文操作输出的时候可能出现中文乱码。这是为什么呢?因为myeclipes在默认情况下,使用的编码表示ASCII表,中文是两个字节存储的,ASCII表示一个字节代表一个字符,强行将中文拆分成两个字节进行解析就会找不到对应字符出现?或者找到的字符不可能是中文的。ASCII码讲中文拆分成两个字节。第一个字节的对应位置一定是负数,第二个常见是负数,可能是正数。

编码表:

  由现实世界的字符和其对应的数值组成的一张表,用来解析和转换各种字符

常见的编码表

  ASCII码表:7位表示一个数据,一个字节表示一个字符。最高位是符号位

    ‘a‘ 97   ’A‘ 65  0 48

  

  ISO-8859-1:拉丁码表   8位表示一个数据

  GB2312:中国的简体中文编码表

  GBK:中国的简体中文编码表升级

  GB18030:GBK的取代版本

  BIG-5:繁体中文编码表,俗称“大五码”

  Unicode:国际标准码,融合了各种文字

       所有文字都用两个字节表示,java语言使用的就是Unicode编码

  UTF-8:国际化编码表,升级版

      最多能用三个字节表示一个字符。就是能用一个字节表示的字符就使用一个字节表示(兼容ASCII),一个用不了的就用两个,实在还不行就使用三个。

编码问题引发小例子:

比如,中国在gbk编码表示的是  10000 和20000

直接到日本的话,日本编码使用shift-JIS  10000   20000分别代表的是か ら,转换过去就曲解了原来的含义了。

时间: 2024-08-23 23:30:31

编码表的概述和常见编码表的相关文章

视频编解码学习之二:编解码框架

第四章 视频编码基础 1. 压缩码流 语法:码流中各个元素的位置关系 01001001… 图像编码类型(01),宏块类型(00),编码系数1001等 语义:每个语法元素所表达的意义. 例如:图像编码类型 2. 编码层次 序列(Sequence) 图像组(Group of Pictures,GOP) 图像(Picture) 条带(Slice) 宏块(Macroblock,MB) 块(Block) 3. 码流结构 3. PB帧编码 4. 序列编码对象 (1)IBBP序列 序列:一段连续编码的并具有相

UTF-8,Unicode,GBK,希腊字母读法,ASCII码表,HTTP错误码,URL编码表,HTML特殊字符,汉字编码简明对照表

UNICODE,GBK,UTF-8区别 UNICODE,GBK,UTF-8区别    简单来说,unicode,gbk和大五码就是编码的值,而utf-8,uft-16之类就是这个值的表现形式.而前面那三种编码是一兼容的,同一个汉字,那三个码值是完全不一样的.如"汉"的uncode值与gbk就是不一样的,假设uncode为a040,gbk为b030,而uft-8码,就是把那个值表现的形式.utf-8码完全只针对uncode来组织的,如果GBK要转UTF-8必须先转uncode码,再转utf-8就O

技术选型——混编APP应用概述

本文主要是针对**APP进行开发之前的技术选型准备文档,现在share出来,希望在做同类开发的您留下宝贵意见. =============================分割线===================================== 一, 主要应用技术 Node.Js Node.js 是一个基于ChromeV8 引擎的 JavaScript 运行环境.Node.js 使用了一个事件驱动.非阻塞式 I/O 的模型,使其轻量又高效.Node.js 的包管理器 npm,是全球最大的开

总线概述及常见总线(转)

一. 总线概念 所谓总线(Bus),是指计算机设备和设备之间传输信息的公共数据通道.总线是连接计算机硬件系统内多种设备的通信线路,它的一个重要特征是由总线上的所有设备共享,可以将计算机系统内的多种设备连接到总线上.如果是某两个设备或设备之间专用的信号连线,就不能称之为总线.系统总线架构图如下所示: 微机中的总线分为数据总线.地址总线和控制总线3类.不同型号的CPU芯片,其数据总线.地址总线和控制总线的条数可能不同. 数据总线DB用来传送数据信息,是双向的.CPU既可通过DB从内存或输入设备读入数

淄博桓台新城赵氏世谱编修完成,专业族谱编修排版印刷制作线装古籍-尚来古籍0533-3580802

2016年底,桓台赵氏来访制作家谱事宜,历时两个月,大功告成.尚来家谱制作中心,专业制作家谱,家谱排版,家谱帮修,古籍修复,古籍影印,字画影印仿真等! 赵氏世谱使用苏式结构排列,老谱采用影印处理方式,新谱采用新排方式. 家谱帮修,排版印刷,宣纸线装,宣纸彩印就找淄博尚来-0533-3580802.

iptables防火墙的概述和常见用法总结

iptables是组成Linux平台下的包过滤防火墙,与大多数的Linux软件一样,这个包过滤防火墙是免费的,它可以代替昂贵的商业防火墙解决方案,完成封包过滤.封包重定向和网络地址转换(NAT)等功能.在日常Linux运维工作中,经常会设置iptables防火墙规则,用来加固服务安全. 以下对iptables的规则使用做了总结性梳理: iptables首先需要了解的:1)规则概念规则(rules)其实就是网络管理员预定义的条件,规则一般的定义为“如果数据包头符合这样的条件,就这样处理这个数据包”

传智播客 2015年 刘意_Java基础视频-深入浅出精华版 笔记(day21~)(2016年3月26日01:10:44)

day21 1.编码表概述和常见编码表 计算机只能识别二进制数据,早期由来是电信号. 为了方便应用计算机,让它可以识别各个国家的文字. 就将各个国家的文字用数字来表示,并一一对应,形成一张表. ASCII:美国标准信息交换码. 用一个字节的7位可以表示. ISO8859-1:拉丁码表.欧洲码表 用一个字节的8位表示. GB2312:中国的中文编码表. GBK:中国的中文编码表升级,融合了更多的中文文字符号. GB18030:GBK的取代版本 BIG-5码 :通行于台湾.香港地区的一个繁体字编码方

JavaSE_ IO流 总目录(19~22)

黑马程序员_JavaSE学习总结第19天_IO流119.01 集合的特点和数据结构总结19.02 如何选择使用哪种集合19.03 集合常见功能和遍历方式总结19.04 异常的概述和分类19.05 JVM默认处理异常19.06 try...catch的方式处理异常1(一个异常)19.07 try...catch的方式处理异常2(两个异常)19.08 JDK7针对多个异常的处理方案19.09 编译期异常和运行期异常的区别19.10 Throwable的几个常见方法19.11 throws的方式处理异

黑马程序员_JavaSE学习总结第21天_IO流3

------- android培训.java培训.期待与您交流! ----------  21.01  转换流出现的原因及格式 由于字节流操作中文不是特别方便,所以,java就提供了转换流. 字符流 = 字节流 + 编码表 21.02  编码表概述和常见编码表 编码表:计算机只能识别二进制数据,早期又来是电信号,为了方便应用计算机,让它可以识别各个国家的文字,就将各个国家的文字用数字来表示,并一一对应,形成一张表,就是编码表. 简单的说编码表就是由字符及其对应的数值组成的一张表.   常见的编码