编码方式小解

ASCII

简介: 最早出现的编码方式,全称:American Standard Code for Information Interchange,美国信息互换标准代码

内容: 大小写字母、数字、标点符号、空格 用连续的字节状态表示(不包括扩展字符集)

长度: 1个字节 8位

数目: 最初0~127 随着计算机的普及扩展到255,后面的被称为“扩展字符集”,终于达到阈值,前128位不变,后面的是扩展集,可改变

GB2312

简介: 国人对ASCII的扩展字符集,前128未不变,两个大于127的字符连在一起时表示一个汉字,前面一个字节(高字节)从0xA1到0xF7,后面一个字节(低字节)从oxA1到oxFE,

组合成大约7000个简体汉字,也加入数字符号,罗马希腊字母,日文假名等,连原有的字母、数字、标点、空格也重新编成两个字节长,这就是“全角字符”,127以下的叫“半角”字符

内容: 原有的基础上加上部分汉字,数学符号,罗马希腊字母,日文假名

长度: 前128 一个字节 8位(半角),后面 两个字节 16位(全角)

GBK,GB18030

简介: GBK是对GBK2312的改进,GB18030是对GBK的改进

内容: 更多的汉字,繁体字,符号,GB18030还包括部分少数民族文字

长度: 前128 一个字节 8位(半角),后面 两个字节 16位(全角)

UNICODE

简介: 为应对各国都弄出的五花八门的编码方式导致乱了套,ISO废了所以的地区性编码方案,搞出一个包括地球上所有文化,字母和符号的编码,全称“Universal Multiple-Octet Coded Character Set”,简称UCS

内容: 地球上所有文化,字母和符号的编码

长度: 全部两个字节 16位,不过前128位的前八位都是0!

与GBK的冲突:在制订时没有考虑与任何一种现有的编码方案保持兼容,这使得 GBK 与UNICODE 在汉字的内码编排上完全是不一样的,没有一种简单的算术方法可以把文本内容从UNICODE编码和另一种编码进行转换,这种转换必须通过查表来进行

UTF-8, UTF-16

简介: 为了解决UNICODE在网络上传输的问题,面向传输的UTF(UCS Transfer Format)标准出现,UTF-8每次8位传输数据,UTF16每次16个位,只不过为了传输时的可靠性,从UNICODE到 UTF时并不是直接的对应,而是要通过一些算法和规则来转换。

国内依旧有人使用GBK,这最初是出于空间的考虑,UNICODE体积较大,但随着电脑空间的扩大已经无关紧要,建议统一使用UTF-8!

Base64

简介: 某些系统只能使用ASCII,Base64就是用来将非ASCII字符的数据转换成ASCII字符的一种方法,例如图片、文档,特别适合在http,mime协议下快速传输数据。

时间: 2024-10-08 17:35:26

编码方式小解的相关文章

转 常见视频编码方式以及封装格式

常见视频编码方式以及封装格式 常见视频编码方式 所谓视频编码方式就是指通过特定的压缩技术,将某个视频格式的文件转换成另一种视频格式文件的方式.视频流传输中最为重要的编解码标准有国际电联的H.261.H.263.H.264.H.265,运动静止图像专家组的M-JPEG和国际标准化组织运动图像专家组的MPEG系列标准,此外在互联网上被广泛应用的还有Real-Networks的RealVideo.微软公司的WMV以及Apple公司的QuickTime等. AVI AVI 是 Audio Video I

刨根究底字符编码之十——Unicode字符集的字符编码方式CEF以及码点、码元

Unicode字符集的字符编码方式CEF以及码点.码元 一.字符编码方式CEF的选择 1. 由于Unicode字符集非常大,有些字符的编号(码点值)需要两个或两个以上字节来表示,而要对这样的编号进行编码,也必须使用两个或两个以上字节. 比如,汉字"严"的Unicode码(Unicode码点值.Unicode编号)是十六进制数4E25,转换成二进制数有15位(100 1110 0010 0101),对"严"这个字符的编号进行编码的话,至少需要2个字节.表示其他更大编号

Unicode代码点与编码方式

一.Unicode字符集 UTF编码,全称是Unicode Transformer Format,这种编码是UCS(Universal Mutiple-Octet Doded Character Set,国际标准ISO10646规定的通用字符集)的实际形式,它的分类是按照其基本长度所占用的位数而定,分为UTF-8/16/32三种形式.UTF可以说是其他字符集的集合,它使得其它字符集是交叉兼容的,可以说,凡是将文字符号转为UCS后再转回原来的编码,也不会丢失信息.UCS包含了现在所有的已知语言的字

Python学习之——编码方式

1.各种编码方式 ASCII:http://zh.wikipedia.org/zh-hans/ASCII Unicode:http://zh.wikipedia.org/zh-hans/Unicode UTF-8:http://zh.wikipedia.org/zh/UTF-8 GBK:http://zh.wikipedia.org/zh/%E6%B1%89%E5%AD%97%E5%86%85%E7%A0%81%E6%89%A9%E5%B1%95%E8%A7%84%E8%8C%83 GB_231

刨根究底字符编码之十三——UTF-16编码方式

UTF-16编码方式 1. UTF-16编码方式源于UCS-2(Universal Character Set coded in 2 octets.2-byte Universal Character Set).而UCS-2,是早期遗留下来的历史产物. UCS-2将字符编号(即码点值)直接映射为字符编码(CEF,而非CES,详见前文中对现代字符编码模型的解释),亦即字符编号就是字符编码,中间没有经过特别的编码算法转换.因此,从现代字符编码模型的角度来看的话,此时并没有将编号字符集CCS与字符编码

Struts2输入校验(编码方式)

struts2对用户输入数据的校验方法有两种方式,一种是通过编码的方式,另一种则是通过使用XML配置方式. 本章主要介绍struts2编码方式的输入校验.以下将结合一个实例程序进行说明. 代码结构: 关键代码: RegistAction.javapackage com.alfred.regist.action; import java.text.SimpleDateFormat; import java.util.Date; import com.opensymphony.xwork2.Acti

MYSQL 编码方式 ------导入 .sql 文件 报编码错误

在做计量泵上位机时,利用MYSQL存储数据,建表hisruninfo(计量泵历史运行数据表). 表格式为utf8,查过数据库 格式 同样为utf8 导入该hisruninfo.sql文件时,并没有报错,表能建起来,但是,导入另外一个插入数据的data1.sql文件时,报错--中文字符不能识别. 插入内容并没有错 后来是将data1.sql 另存为.sql 文件时,编码方式该位 utf8  之后就能导入!  导入.sql文件 命令:source

刨根究底字符编码之十一——UTF-8编码方式与字节序标记

UTF-8编码方式与字节序标记 一.UTF-8编码方式 1. 接下来将分别介绍Unicode字符集的三种编码方式:UTF-8.UTF-16.UTF-32.这里先介绍应用最为广泛的UTF-8. 为满足基于ASCII.面向字节的字符处理的需要,Unicode标准中定义了UTF-8编码方式.UTF-8应该是目前应用最广泛的一种Unicode编码方式(但不是最早面世的,UTF-16要早于UTF-8面世).它是一种使用8位码元(即单字节码元)的变宽(即变长或不定长)码元序列的编码方式. 由于UTF-16对

eclipse编码方式、标签语言获取根目录

1.设置工作空间编码方式: window-->preference-->general -->workspace 中设置Text file encoding 把编码方式改为UTF-8 2.设置jsp文件的编码方式,默认是latin-1,是不支持中文的.window-->preferences-->web--> JSP Files 中选择Encoding,把编码方式改为UTF-8. 3.修改常用文件编码方式window-->preferences-->gene