为什么ASCII是7位(导致各家编码的128~256字符都不同,给我带来很多困惑)——在标准ASCII中,其最高位(b7)用作奇偶校验位,附ASCII每个控制符的中文解释

ASCII编码

ASCII是基于拉丁字母的一套电脑编码系统。它主要用于显示现代英语和其他西欧语言。它是现今最通用的单字节编码系统,并等同于国际标准ISO/IEC 646

请注意,ASCII是American Standard Code for Information Interchange缩写,而不是ASC2,有很多人在这个地方产生误解。

ASCII 码使用指定的7 位或8 位二进制数组合来表示128或256 种可能的字符。标准ASCII 码也叫基础ASCII码,使用7 位二进制数来表示所有的大写和小写字母,数字0 到9、标点符号,以及在美式英语中使用的特殊控制字符。其中:

0~31及127(共33个)是控制字符或通信专用字符(其余为可显示字符

32~126(共95个)是字符(32是空格),其中48~57为0到9十个阿拉伯数字。

65~90为26个大写英文字母,97~122号为26个小写英文字母,其余为一些标点符号、运算符号等。

同时还要注意,在标准ASCII中,其最高位(b7)用作奇偶校验位。所谓奇偶校验,是指在代码传送过程中用来检验是否出现错误的一种方法,一般分奇校验和偶校验两种。奇校验规定:正确的代码一个字节中1的个数必须是奇数,若非奇数,则在最高位b7添1;偶校验规定:正确的代码一个字节中1的个数必须是偶数,若非偶数,则在最高位b7添1。

后128个称为扩展ASCII码。许多基于x86的系统都支持使用扩展(或“高”)ASCII。扩展ASCII 码允许将每个字符的第8 位用于确定附加的128 个特殊符号字符、外来语字母和图形符号。

标准ASCII码如下:


二进制


十进制


十六进制


缩写/字符


解释


0000 0000


0


00


NUL(null)


空字符


0000 0001


1


01


SOH(start of headline)


标题开始


0000 0010


2


02


STX (start of text)


正文开始


0000 0011


3


03


ETX (end of text)


正文结束


0000 0100


4


04


EOT (end of transmission)


传输结束


0000 0101


5


05


ENQ (enquiry)


请求


0000 0110


6


06


ACK (acknowledge)


收到通知


0000 0111


7


07


BEL (bell)


响铃


0000 1000


8


08


BS (backspace)


退格


0000 1001


9


09


HT (horizontal tab)


水平制表符


0000 1010


10


0A


LF (NL line feed, new line)


换行键


0000 1011


11


0B


VT (vertical tab)


垂直制表符


0000 1100


12


0C


FF (NP form feed, new page)


换页键


0000 1101


13


0D


CR (carriage return)


回车键


0000 1110


14


0E


SO (shift out)


不用切换


0000 1111


15


0F


SI (shift in)


启用切换


0001 0000


16


10


DLE (data link escape)


数据链路转义


0001 0001


17


11


DC1 (device control 1)


设备控制1


0001 0010


18


12


DC2 (device control 2)


设备控制2


0001 0011


19


13


DC3 (device control 3)


设备控制3


0001 0100


20


14


DC4 (device control 4)


设备控制4


0001 0101


21


15


NAK (negative acknowledge)


拒绝接收


0001 0110


22


16


SYN (synchronous idle)


同步空闲


0001 0111


23


17


ETB (end of trans. block)


传输块结束


0001 1000


24


18


CAN (cancel)


取消


0001 1001


25


19


EM (end of medium)


介质中断


0001 1010


26


1A


SUB (substitute)


替补


0001 1011


27


1B


ESC (escape)


换码(溢出)


0001 1100


28


1C


FS (file separator)


文件分割符


0001 1101


29


1D


GS (group separator)


分组符


0001 1110


30


1E


RS (record separator)


记录分离符


0001 1111


31


1F


US (unit separator)


单元分隔符


0010 0000


32


20


(space)


空格


0010 0001


33


21


!


 


0010 0010


34


22


"


 


0010 0011


35


23


#


 


0010 0100


36


24


$


 


0010 0101


37


25


%


 


0010 0110


38


26


&


 


0010 0111


39


27



 


0010 1000


40


28


(


 


0010 1001


41


29


)


 


0010 1010


42


2A


*


 


0010 1011


43


2B


+


 


0010 1100


44


2C


,


 


0010 1101


45


2D


-


 


0010 1110


46


2E


.


 


00101111


47


2F


/


 


00110000


48


30


0


 


00110001


49


31


1


 


 


00110010


50


32


2


 


 


00110011


51


33


3


 


 


00110100


52


34


4


 


 


00110101


53


35


5


 


 


00110110


54


36


6


 


 


00110111


55


37


7


 


 


00111000


56


38


8


 


 


00111001


57


39


9


 


 


00111010


58


3A


:


 


 


00111011


59


3B


;


 


 


00111100


60


3C


<


 


 


00111101


61


3D


=


 


 


00111110


62


3E


>


 


 


00111111


63


3F


?


 


 


01000000


64


40


@


 


 


01000001


65


41


A


 


 


01000010


66


42


B


 


 


01000011


67


43


C


 


 


01000100


68


44


D


 


 


01000101


69


45


E


 


 


01000110


70


46


F


 


 


01000111


71


47


G


 


 


01001000


72


48


H


 


 


01001001


73


49


I


 


 


01001010


74


4A


J


 


 


01001011


75


4B


K


 


 


01001100


76


4C


L


 


 


01001101


77


4D


M


 


 


01001110


78


4E


N


 


 


01001111


79


4F


O


 


 


01010000


80


50


P


 


 


01010001


81


51


Q


 


 


01010010


82


52


R


 


 


01010011


83


53


S


 


 


01010100


84


54


T


 


 


01010101


85


55


U


 


 


01010110


86


56


V


 


 


01010111


87


57


W


 


 


01011000


88


58


X


 


 


01011001


89


59


Y


 


 


01011010


90


5A


Z


 


 


01011011


91


5B


[


 


 


01011100


92


5C


\


 


 


01011101


93


5D


]


 


 


01011110


94


5E


^


 


 


01011111


95


5F


_


 


 


01100000


96


60


`


 


 


01100001


97


61


a


 


 


01100010


98


62


b


 


 


01100011


99


63


c


 


 


01100100


100


64


d


 


 


01100101


101


65


e


 


 


01100110


102


66


f


 


 


01100111


103


67


g


 


 


01101000


104


68


h


 


 


01101001


105


69


i


 


 


01101010


106


6A


j


 


 


01101011


107


6B


k


 


 


01101100


108


6C


l


 


 


01101101


109


6D


m


 


 


01101110


110


6E


n


 


 


01101111


111


6F


o


 


 


01110000


112


70


p


 


 


01110001


113


71


q


 


 


01110010


114


72


r


 


 


01110011


115


73


s


 


 


01110100


116


74


t


 


 


01110101


117


75


u


 


 


01110110


118


76


v


 


 


01110111


119


77


w


 


 


01111000


120


78


x


 


 


01111001


121


79


y


 


 


01111010


122


7A


z


 


 


01111011


123


7B


{


 


 


01111100


124


7C


|


 


 


01111101


125


7D


}


 


 


01111110


126


7E


~


 


 


01111111


127


7F


DEL (delete)


删除

http://blog.csdn.net/u012152619/article/details/43235747

时间: 2024-12-19 19:49:13

为什么ASCII是7位(导致各家编码的128~256字符都不同,给我带来很多困惑)——在标准ASCII中,其最高位(b7)用作奇偶校验位,附ASCII每个控制符的中文解释的相关文章

自然语言分析工具Hanlp依存文法分析python使用总结(附带依存关系英文简写的中文解释)

最近在做一个应用依存文法分析来提取文本中各种关系的词语的任务.例如:text='新中国在马克思的思想和恩格斯的理论阔步向前': ps:这里马克思和恩格斯原来我是用的毛zd和邓xp,但是系统说这两个名字违规了........我很爱国的好不好!!!!!! 我需要提取这个text中的并列的两个关系,从文中分析可知,"马克思的思想"和"恩格斯的理论"是两个并列关系的短语,所以想要将其提取出来: 首先大致了解一下依存文法分析的前提条件,将句子分词并进行词性标注,这一步非常关键

LoadRunner函数大全之中文解释

LoadRunner函数大全之中文解释

Atitit.&#160;二进制数据ascii表示法,与base64编码解码api&#160;设计标准化总结java&#160;php&#160;c#.net

Atitit. 二进制数据ascii表示法,与base64编码解码api 设计标准化总结java php c#.net 1. Base64编码,1 1.1. 子模式 urlsafe Or  url unsafe2 1.2. 其他的二进制数据表示法  bin2hex() ,Quoted-printable ,UUencode2 2. Base64常用api2 2.1. ------------解码api2 2.2. decode(String s, OutputStream out)2 2.3. 

ASCII,Utf8,Unicode编码下的中英文字符大小

一,测试Demo namespace 不同编码下的中英文字符大小 { class Program { static void Main(string[] args) { ShowCode(); } private static void ShowCode() { string[] strArray = { "b","abc","乙","甲乙丙丁"}; byte[] buffer; string mode, back; fore

FCKeditor插件 中文解释

AutoDetectLanguage=true/false 自动检测语言 BaseHref="" 相对链接的基地址 ContentLangDirection="ltr/rtl" 默认文字方向 ContextMenu=字符串数组,右键菜单的内容 CustomConfigurationsPath="" 自定义配置文件路径和名称 Debug=true/false 是否开启调试功能,这样,当调用FCKDebug.Output()时,会在调试窗中输出内容

编码解码--三种常见字符编码简介:ASCII、Unicode和UTF-8

什么是字符编码? 计算机只能处理数字,如果要处理文本,就必须先把文本转换为数字才能处理.最早的计算机在设计时采用8个比特(bit)作为一个字节(byte),所以,一个字节能表示的最大的整数就是255(二进制11111111=十进制255),如果要表示更大的整数,就必须用更多的字节.比如两个字节可以表示的最大整数是65535,4个字节可以表示的最大整数是4294967295. ASCII编码: 由于计算机是美国人发明的,因此,最早只有127个字母被编码到计算机里,也就是大小写英文字母.数字和一些符

Linux常用命令英文全称与中文解释 (pwd、su、df、du等)

https://blog.csdn.net/qq_40334837/article/details/83819735 Linux常用命令英文全称与中文解释 apt: Advanced Packaging Tool 高级包装工具 cp: Copy file  复制文件 cat: Concatenate  串联 cd:Change directory 切换目录 chmod: Change mode 改变模式 chown: Change owner 改变所有者 chgrp: Change group

nginx 中文解释

Nginx配置参数中文详细说明: #定义Nginx运行的用户和用户组user www www;##nginx进程数,建议设置为等于CPU总核心数.worker_processes 8;##全局错误日志定义类型,[ debug | info | notice | warn | error | crit ]error_log /var/log/nginx/error.log info;##进程文件pid /var/run/nginx.pid;##一个nginx进程打开的最多文件描述符数目,理论值应该

【字符编码】彻底理解字符编码

一.前言 在解决昨天的问题时,又引出了很多新的问题,如为什么要进行编码,这些编码的关系如何,如ASCII,IOS-8859-1,GB2312,GBK,Unicode之间的关系,笔者想要彻底理解字符编码背后的故事,遂进行了探索,具体笔记如下.如园友能读完本篇文章,我相信会解开很多疑惑. 二.字符编码 2.1 为何需要编码? 我们知道,所有的信息最终都表示为一个二进制的字符串,每一个二进制位(bit)有0和1两种状态.当我们需要把字符'A'存入计算机时,应该对应哪种状态呢,存储时,我们可以将字符'A