python攻克之路day2

day2内容

  1. 二进制以及编码

1.二进制以及编码

python解释器在加载 .py 文件中的代码时,会对内容进行编码(默认ascill)

ASCII(American Standard Code for Information Interchange,美国标准信息交换代码)是基于拉丁字母的一套电脑编码系统,主要用于显示现代英语和其他西欧语言,其最多只能用 8 位来表示(一个字节),即:2**8 = 256-1,所以,ASCII码最多只能表示 255 个符号。

编码和二进制(基础知识)

计算机存储,网络传输,内存计算用的都是 01010101010101010101

ascii码,8位表示一个字符。

由于最早开始并没有考虑到计算机将会全球化,美国发明计算机之初对ASCII编码只有到7位已满足美国单一国家使用后面扩展到8位,

是发明者保留了。

随着计算机在全球范围的广泛使用、显然ASCII码无法将世界上的各种文字和符号全部表示,所以,就需要新出一种可以代表所有字符和符号的编码,即:Unicode

Unicode(统一码、万国码、单一码)是一种在计算机上使用的字符编码。Unicode 是为了解决传统的字符编码方案的局限而产生的,它为每种语言中的每个字符设定了统一并且唯一的二进制编码,规定虽有的字符和符号最少由 16 位来表示(2个字节),即:2 **16 = 65536,

注:此处说的的是最少2个字节,可能更多

Unicode弊端:

    局限性只有2**16位 = 65535

    不能满足存放更多的文字。

Unicode于是32位出来了。

32位 4个字节

其弊端:

00000000    00000000     00000000   00001001    -----> 假设代表A

00000000    00000000     00000000   00011001    -----> 假设代表B

00000000    00000000     00000000   00101000    -----> 假设代表C

原来 ABC各一个字节都能存放的,其余多出的空间浪费掉了

针对这种情况,又出了一种叫做UTF-8的字符集

对Uniocode进行优化的编码:用最少的位数表示所有的文字

下面是上描述的图:  用最少的位数表示所有的文字 在UTF-8 A的编码占的字节 ------->00001001   utf-8(一个汉字,占3个字节)

UTF-8好处在于能够把所有的字符都包含,对于一些不需要很多位字节的进行压缩。

GBK编码,不考虑别的国家的编码集,它跟UTF-8一样,用最少的位数表示所有的文字,缺点:不考虑其他国家的文字,只能解析中文 ,汉字(占2个字节)

  

时间: 2025-01-07 03:17:22

python攻克之路day2的相关文章

python攻克之路day1

day1内容 1 .............................数据类型介绍.............................. 计算机顾名思义就是可以做数学计算的机器,因此,计算机程序理所当然地可以处理各种数值.但是,计算机能处理的远不止数值, 还可以处理文本.图形.音频.视频.网页等各种各样的数据,不同的数据,需要定义不同的数据类型.在Python中,能够直接处理的数据类型有以下几种 python数据类型基本结构: 整数 ---------->  num = 1 布尔型

Python实战之路-day2

我们始终都要远行,最终都要与稚嫩的自己告别,告别是通向成长的苦行之路. Hello Python - day2! Python中的五种内建数据结构: 变量     name = "guanqing" 列表    name = ['user1','user2','user3'] 字典       name = {'name':'guanqing','age':28} 文件       file.txt 数据库    mysql 列表: list.append('aa')  #增加. 列表

python学习之路-day2

Python的强大之处在于他有非常丰富和强大的标准库和第三方库 运行下列代码,会出现一系列路径,其中python的第三方库一般存在site-package,比如D:\\Program Files\\Anaconda3\\lib\\site-packages,标准库则在其上一级,即:D:\\Program Files\\Anaconda3\\lib import sysprint(sys.path) 小技巧:返回值为0表示执行成功了:PS:2**=2^ 都是求幂:55E4=55X10^4=55X1

python 学习之路-day2

第二天找到点信心,这个代码居然看懂了呢. ####引入变量name根据提示输入你的名字 name = input('please input your name :')print ('hello!'+(name)) ####演示输出函数的实例 print ('a','b','c')print ('a','b','c',sep=',')print ('a','b','c',end=';')print ('a','b','c') ####python的四则运算 >>>3*5/2+4*2 &g

Python学习之路day2

一: 字符串的格式化输出 name = "abc" name2 = 123 name3 = 22 name4 = "abc\n\t123" abc = ''' name : %s name2 : %d name3 : %f name4 : %r name5 : %s '''%(name,name2,name3,name4,name4) print(abc) 结果为: 如上例,总结如下位 %s :  输入字符串 %d : 只能输出数字,否则会报错 %f : 显示浮点数

Python之路,Day2 - Python基础2

Python之路,Day2 - Python基础2 本节内容 列表.元组操作 字符串操作 字典操作 集合操作 文件操作 字符编码与转码 1. 列表.元组操作 列表是我们最以后最常用的数据类型之一,通过列表可以对数据实现最方便的存储.修改等操作 定义列表 1 names = ['Alex',"Tenglan",'Eric'] 通过下标访问列表中的元素,下标从0开始计数 1 2 3 4 5 6 7 8 >>> names[0] 'Alex' >>> na

Python学习之路-Day1-Python基础

Python学习之路第一天 学习内容: 1.Python简介 2.安装 3.第一个Python程序 4.变量 5.字符编码 6.用户输入 7.表达式if..else语句 8.表达式for语句 9.break和continue 10.while循环 11.字符串格式化 1.python简介 python的创始人为吉多·范罗苏姆(Guido van Rossum).1989年的圣诞节期间,吉多·范罗苏姆为了在阿姆斯特丹打发时间,决心开发一个新的脚本解释程序,作为ABC语言的一种继承. 最新的TIOB

Python学习之路

Python学习之路 目录 Python学习之路[第一篇]:流程控制,用户交互,语法要求,变量,字符,注释,模块导入的使用 Python学习之路[第二篇]:文件,字符串,列表,元组,字典,集合的使用 更新中...

Python爬虫之路——简单的网页抓图

转载自我自己的博客:http://www.mylonly.com/archives/1401.html 用Python的urllib2库和HTMLParser库写了一个简单的抓图脚本,主要抓的是http://desk.zol.com.cn/meinv/这个链接下的图片,通过得到图集的起始URL地址,得到第一张图片,然后不断的去获取其下一个图片的URL,继而得到所有首页的图集的图片. 整个源码如下,比较简单,写这个只是简单的练手而已 #coding: utf-8 #################