字典查询快的原因
字符编码
函数定义
局部变量、全局变量
返回值
嵌套函数
递归(二分查找)
三元运算
map
lamba
函数式编程
高阶函数
内置函数
字典占用内存比列表多,但是查询速度比列表快的多
为什么会查询速度会快呢?因为他是hash类型的,那什么是hash呢?
哈希算法将任意长度的二进制值映射为较短的固定长度的二进制值,这个小的二进制值称为哈希值。哈希值是一段数据唯一且极其紧凑的数值表示形式。如果散列一段明文而且哪怕只更改该段落的一个字母,随后的哈希都将产生不同的值。要找到散列为同一个值的两个不同的输入,在计算上是不可能的,所以数据的哈希值可以检验数据的完整性。一般用于快速查找和加密算法
dict会把所有的key变成hash 表,然后将这个表进行排序,这样,你通过data[key]去查data字典中一个key的时候,python会先把这个key hash成一个数字,然后拿这个数字到hash表中看没有这个数字, 如果有,拿到这个key在hash表中的索引,拿到这个索引去与此key对应的value的内存地址那取值就可以了。
那为什么会快呢?通过数字去hash表中查看数字时,采用某种算法,maybe是二分法,查询的次数很少。
key -->hash值-->类似二分查找,找到hash值索引-->value对应的内存地址
字符编码
先说python2
- py2里默认编码是ascii
- 文件开头那个编码声明是告诉解释这个代码的程序 以什么编码格式 把这段代码读入到内存,因为到了内存里,这段代码其实是以bytes二进制格式存的,不过即使是2进制流,也可以按不同的编码格式转成2进制流,你懂么?
- 如果在文件头声明了#_*_coding:utf-8*_,就可以写中文了, 不声明的话,python在处理这段代码时按ascii,显然会出错, 加了这个声明后,里面的代码就全是utf-8格式了
- 在有#_*_coding:utf-8*_的情况下,你在声明变量如果写成name=u"大保健",那这个字符就是unicode格式,不加这个u,那你声明的字符串就是utf-8格式
- utf-8 to gbk怎么转,utf8先decode成unicode,再encode成gbk
再说python3
- py3里默认文件编码就是utf-8,所以可以直接写中文,也不需要文件头声明编码了,干的漂亮
- 你声明的变量默认是unicode编码,不是utf-8, 因为默认即是unicode了(不像在py2里,你想直接声明成unicode还得在变量前加个u), 此时你想转成gbk的话,直接your_str.encode("gbk")即可以
- 但py3里,你在your_str.encode("gbk")时,感觉好像还加了一个动作,就是encode的数据变成了bytes里,我操,这是怎么个情况,因为在py3里,str and bytes做了明确的区分,你可以理解为bytes就是2进制流,你会说,我看到的不是010101这样的2进制呀, 那是因为python为了让你能对数据进行操作而在内存级别又帮你做了一层封装,否则让你直接看到一堆2进制,你能看出哪个字符对应哪段2进制么?什么?自己换算,得了吧,你连超过2位数的数字加减运算都费劲,还还是省省心吧。
- 那你说,在py2里好像也有bytes呀,是的,不过py2里的bytes只是对str做了个别名,没有像py3一样给你显示的多出来一层封装,但其实其内部还是封装了的。 这么讲吧, 无论是2还是3, 从硬盘到内存,数据格式都是 010101二进制到-->b‘\xe4\xbd\xa0\xe5\xa5\xbd‘ bytes类型-->按照指定编码转成你能看懂的文字
总结:
utf8中一个中文占3个字节
python2中utf8转gbk 先decode成unicode 再encode成gbk
只有unicode能encode、decode
编码应用比较多的场景应该是爬虫了,互联网上很多网站用的编码格式很杂,虽然整体趋向都变成utf-8,但现在还是很杂,所以爬网页时就需要你进行各种编码的转换,不过生活正在变美好,期待一个不需要转码的世界。
函数的定义
定义: 函数是指将一组语句的集合通过一个名字(函数名)封装起来,要想执行这个函数,只需调用其函数名即可
特性:
- 减少重复代码
- 使程序变的可扩展
- 使程序变得易维护
函数的定义主要有如下要点:
- def:表示函数的关键字
- 函数名:函数的名称,日后根据函数名调用函数
- 函数体:函数中进行一系列的逻辑计算,如:发送邮件、计算出 [11,22,38,888,2]中的最大数等...
- 参数:为函数体提供数据
- 返回值:当函数执行完毕后,可以给调用者返回数据。
def func(name):#func函数名,name参数 print(‘my name is‘,name)#函数体 func(‘hongpeng‘)#调用func函数
形参:变量只有在被调用时才分配内存单元,在调用结束时,即刻释放所分配的内存单元。因此,形参只在函数内部有效。函数调用结束返回主调用函数后则不能再使用该形参变量
实参:可以是常量、变量、表达式、函数等,无论实参是何种类型的量,在进行函数调用时,它们都必须有确定的值,以便把这些值传送给形参。因此应预先用赋值,输入等办法使参数获得确定值
上面的例子中name就是形参,‘hongpeng‘就是实参
函数的几种参数
普通参数
像下面例子中的name,age,job
默认参数
在定义函数时直接赋值,调用函数如果不指明默认就是定义函数时赋的值,指明的话就是你赋的值,定义时特别要注意默认参数在最后。
def inf(name,age,job,country=‘CN‘): print(‘the information of %s‘.center(50,‘-‘)%name) print(‘name:‘,name) print(‘age:‘,age) print(‘job:‘,job) print(‘country:‘,country) inf(‘hongpeng‘,21,‘ops‘) inf(‘alex‘,31,‘loser‘,‘JP‘) #输出 --------------the information of hongpeng--------------- name: hongpeng age: 21 job: ops country: CN --------------the information of alex--------------- name: alex age: 31 job: loser country: JP
关键参数
正常情况下,给函数传参数要按顺序,如果一个函数中参数太多或者不想按顺序就可以用关键参数,只需调用时指定参数名即可,好像没什么卵用。。。非固定参数**kwargs在传参数的时候会用到。
非固定参数
若你的函数在定义时不确定用户想传入多少个参数,就可以使用非固定参数
*args
def inf(name,age,job,*args):#*args会把多个传入的参数放入一个元组中 print(name,age,job,args) inf(‘hongpeng‘,21,‘ops‘) inf1(‘hongpeng‘,21,‘ops‘,‘CN‘,‘python‘) #输出 hongpeng 21 ops ()#因为没有传值,所以args为空 hongpeng 21 ops (‘CN‘, ‘python‘)
**kwargs
def inf(name,age,job,**kwargs):#**kwargs把传入参数放在字典中,所以调用时参数得用关键参数的形式 print(name,age,job,kwargs) inf(‘hongpeng‘,21,‘ops‘) inf(‘hongpeng‘,21,‘ops‘,country = ‘CN‘,lesson = ‘python‘) #输出 hongpeng 21 ops {} hongpeng 21 ops {‘lesson‘: ‘python‘, ‘country‘: ‘CN‘}
局部变量和全局变量
在子程序中定义的变量称为局部变量,在程序的一开始定义的变量称为全局变量。
全局变量作用域是整个程序,局部变量作用域是定义该变量的子程序。
当全局变量与局部变量同名时:
在定义局部变量的子程序内,局部变量起作用;在其它地方全局变量起作用。
全局变量最好都用大写
name = ‘alex‘ def inf(): name = ‘hongpeng‘ print(‘函数里面的name:‘,name) inf() print(‘函数外的name:‘,name)
函数里面的name改变并没有影响到外部的name
如果想在函数里面对全局变量改变,用global,但是一般不会在函数里面去改全局变量的值,so,忘了它吧。
name = ‘alex‘ def inf(): global name name = ‘hongpeng‘ print(‘函数里面的name:‘,name) inf() print(‘函数外的name:‘,name) #输出 函数里面的name: hongpeng 函数外的name: hongpeng
返回值
返回值
1.一旦你的函数经过调用并开始执行,那函数外部的程序就没有办法再控制函数的执行过程,此时外部程序只能等待函数的执行结果
为什么要等待执行结果?
因为外部函数要根据函数的返回值来决定下一步怎么走,执行结果就是以return的形式返回给外部程序
2 return代表一个函数的结束
3.return可以返回任意数据类型
4.对于用户角度,函数可以返回任意数量的值,但对于python本身来讲,函数只能返回一个值,多个放在一个元组中
5.如果函数不加return,默认是返回None
练习:
进入购物商城,首先要登录,登录之后访问任意网页都不再需要登录
嵌套函数
name = ‘ALEX‘ def name(): name = ‘alex‘ def name2(): name = ‘hongpeng‘ print(‘3name:‘,name) name2() print(‘2name‘,name) name() #输出 3name: hongpeng 2name alex
递归函数