计算机怎么看懂英语和汉语等非二进制语言?

计算机只识别二进制,它是怎么去识别英语,汉语等人类可以通信的语言呢?想知道这个问题就要先说二进制....

讲1个有趣的故事学习二进制的由来

古时候,2个远距离通信,通过马和飞鸽,还有狼烟......

北京到昌平之间 10公里,需要狼烟传信。

如果来了2个敌人,友军来了500人,浪费资源。

如何能资源合理利用,传得信息刚好?

怎么办?

1-100人------------------1根狼烟

101-200------------------2根狼烟

200-300------------------3根狼烟


10万敌人-------------------?这个方法行不通

重新定义:    1---1000 人             1根狼烟

1000----5000人        2根狼烟

5000---10000人         3根狼烟

缺点:怎么去识别是1000?还是2000?    不精确--------------这个方法也行不通

需要重新定义:

把定义写死,一点那根烟表示2个敌人,4个敌人,8个敌人......

1024    521     256     128      64      32     16       8     4     2敌人        1敌人

1          1         1         1         1        1       1        1     1    1根烟         1根烟

来个6个敌人:..110-------------2根

来了7个敌人:..111-------------3根

来个9个敌人:..1001------------2根

来了10个敌人:..1010-----------2根

-----------------

来个128个敌人:1000 0000-----1根

————————————————

4根烟-----2**4=16               来了15个敌人

................

................

16根烟-----2**16=65536       来了6万多敌人

---

32根烟-----2**32=42亿          可以表示42亿敌人

以上是二进制表示数字,那么怎么让二进制表示字符串?

二进制----------->>数字---------->>字符串(ASCII)   

a<----------------97<---------------二进制  0110 0001

ASCII表----127,表示占了7根狼烟  0111 1111

127是半张表,整张表是255

110       =6

1111    = 15

11111  =31

计算机存的是二进制流

110111111111,

那么问题来了,分不清楚,存的是6还是15还是31?空格和逗号也是二进制,

解决问题:需要固定一个长度: 规定计算机8位8位的取数

0000 0110   =16

0000 1111   =15

0001 1111   =31

字节概念的由来:

计算机8位8位的取数 ,是因为有ASCII才有个8位bit表示一个字节,也就是字节的概念;

8位一共是256种状态,255个数。美国人占127位,剩下的128位里有一小部分表示给中国使用

问题又出现了----->>>中国有汉字,怎么表示?-------自己做表--------映射到ASCII上去(后面128位里很小的一部分)

比如:120-200给中国,那么120,121可以表示一个汉字。

字符编码:是2进制到字符的表示的一张表  ---->>ASCII表

中国第一个字符表:GB2312(1980)

1980年  7445个字符,6763个汉字。

1995年  GBK1.0 = 20000左右个字符和汉字

2000年  GB18030 = 27000 个汉字,包括藏文,少数名族文

BIG5  台湾人的编码集

问题来了:

日本韩国,各个国家都有自己的编码集,对应集.

ISO标准组织,自己搞了一套unicode,1个字符占4个字节。UTF-32

4个字节是32位,全占满,是2**32的字符。浪费很多

UTF-16 一个字符,占2个字节,65535个字符。

美国人还是嫌太占硬盘空间

utf-8 可变长的字符编码 一个英文占一个字节,一个中文占3个字节,欧洲占2个字节

世界上最流行的字符编码集utf-8.

1个二进制数字 = 1比特  bit =计算机的最小数据单位---- 0或1

8个比特 = 1bytes  字节------ 现有bit后又ASCII再有的byte

1024byte = 1kbytes  kb

1024kb   = 1million bit  = 1mb  1兆

1024mb = 1GB,10亿bit

1024gb = 1TB

....................

时间: 2024-07-30 23:52:00

计算机怎么看懂英语和汉语等非二进制语言?的相关文章

看懂Gradle脚本(2)- Groovy语言的闭包语法

本篇文章讨论下面这一小段Gradle脚本: repositories { mavenCentral() } 闭包字面量 闭包字面量看起来像Java里的代码块:用一对儿花括号包起来.前面讨论过,方法调用的圆括号可以省略,补上圆括号之后,脚本看起来是这样: repositories({ // <-- mavenCentral() }) 如果闭包是方法的最后一个参数,那么闭包可以放在圆括号外面 也就是说,上面的代码写成这样也是可以的: repositories() { // <-- mavenCen

看懂Gradle脚本(1)- Groovy语言的Map语法糖

这一系列文章是写给刚开始使用Gradle,并且对Groovy语法不是特别了解的Java程序员看的. 本篇文章的目标是解释清楚下面这行Gradle脚本: apply plugin: 'java' 行尾的分号是可选的 用过JavaScript语言的人对这个语法糖应该比较熟悉,下面是补上分号后的脚本: apply plugin: 'java'; Map字面量(Literal) Java语言只有基本类型.String和数组是有字面量的,如下所示: boolean b = false; int i = 1

你的计算机也可以看懂世界(一)——十分钟跑起卷积神经网络(Windows+CPU)

学习.使用卷积神经网络已经挺久了,期间一直在基于贾扬清大神的Caffe框架来研究别人的模型,抑或是在无聊的时候以近似于算命一样的方式,眼睛微闭,摇头晃脑,口中不时漏出几个音节,半晌便DIY出一个自认为改进颇多的模型,然后去跑一下,当然结果是非常惨淡的(要不然我就直接发论文了哪有这么闲还来写博客...),从这个过程中,我深刻地体会到了"前人栽树后人乘凉"这句话的正确性,虽然贾大神这个前人也不比我等大上几岁.今天听说贾大神宣布了最新的可以在移动设备上进行训练和测试的Caffe框架,心想我知

31张图看懂初高中所有英语语法

31张图看懂初高中所有英语语法

一张图看懂原码、反码、补码、移码

前言 原码.反码.补码其实两年前就讲过,只是当时的理解太过肤浅或者直接说就是没有理解,因为对于数学比较发怵的我看到那么多的公式很是脑袋大,所以想要硬记也记不住.这次讲课的时候好歹知道了运算规则,但别人一问为什么,立马那个冏啊~好了,废话不多说了,开始进入正题(如果我的理解有偏差,恳请各位大虾不吝指出): 一张图胜过千言万语,下面的这张是本篇想要说的大概内容 原码 我们知道,计算机是以0和1进行运算的,而且内部只有加法运算器,但日常生活中使用的却是十进制,并且有正负之分.于是我们发明了原码:最高位

如何教你看懂复杂的正则表达式

[前言] 1.此文针对,正则表达式的初学者,老鸟请飘过. 正则表达式的初学者,常遇到的情况是,对于相对复杂一点的正则表达式,觉得很难理解,很难看懂. 2.此文目的,之前你看不懂,看了此教程后,就基本掌握了,看懂复杂正则表达式的思路. 这样就可以通过自己的能力,一点点把复杂的正则表达式,一点点拆分,一点点分析,知道完全理解. 3.在看此文之前,肯定需要你本身对于正则表达式,已经有了一些基本的基础, 比如知道点’.’表示任意字符,星号’*’表示0或多个之类的含义,这样才有看此文的基础. 关于正则表达

看懂影片标题,各种电影视频格式标题的含义

一.资源片源解析 根据命名,可以知道资源的来源,从而判断资源画质的好坏. 1.CAM(枪版)——珍爱生命,远离枪版  CAM通常是用数码摄像机从电影院盗录.有时会使用小三角架,但大多数时候不可能使用,所以摄像机会抖动.因此我们看到画面通常偏暗.人物常常会失真,视频画面时常会出现倾斜.抖动. 由于声音是电影院现场录制,所以经常会录到观众的笑声等杂音.因为这些因素,图象.声音质量通常都很差. 举例说明:Journey.To.The.Center.Of.The.Earth.CAM.XViD-CAMER

只有程序员可以看懂的笑话 大全集(2)

1.程序猿最烦两件事,第一件事是别人要他给自己的代码写文档,第二件呢?是别人的程序没有留下文档. 2.程序猿的读书历程:x 语言入门 -> x 语言应用实践 -> x 语言高阶编程 -> x 语言的科学与艺术 -> 编程之美 -> 编程之道 -> 编程之禅-> 颈椎病康复指南. 3.还没上大学的时候,高三暑假,跑到家那边的图书城想买传说中的C++的书,然后看到一本C#,我一看,嘿,这个++还写得挺艺术的,重叠起来了,于是把C#买了回来-- 4.问:程序猿最讨厌康熙

只有程序员可以看懂的笑话 大全集(1)

宪法顶个球!中国的法律都是.txt文件,不是.exe文件. 程序员:三年前,当我写下这个的时候,只有上帝和我能够看懂. 现在,只有 上帝能看懂了. 同事说,他在写i++的时候总觉的自己写的是 我艹.........有木有同感??? ? 程序员,年二十有二,始从文,连考而不中. 遂习武,练武场上发一矢,中鼓 吏,逐之出. 改学IT,自撰一函数,用之,堆栈溢出. <桃花庵--程序员版>写字楼里写字间,写字间中程序员: 程序人员写程序, 又将程序换酒钱: 酒醒只在屏前坐,酒醉还来屏下眠: 酒醉酒醒日