1.迭代器与生成器 2.装饰器 1.迭代器与生成器 迭代器 迭代是Python最强大的功能之一,是访问集合元素的一种方式。 迭代器是一个可以记住遍历的位置的对象。 迭代器对象从集合等第一个元素开始访问,直到所有的元素被访问结束,迭代器只能往前不会后退。 迭代器有两个基本的方法:iter()和next() 字符串,列表或元组对象都可以用于创建迭代器。 迭代器的一大优点是不要求事先准备好整个迭代过程中所有的元素。迭代器仅仅在迭代到某个元素时才计算该元素,而在这之前或之后,元素可以不存在或者被销毁。这个特点使得它特别适合用于遍历一些巨大的或是无限的集合,比如几个G的文件 特点: 访问者不需要关心迭代器内部的结构,仅需通过next()方法不断去取下一个内容不能随机访问集合中的某个值 ,只能从头到尾依次访问访问到一半时不能往回退便于循环比较大的数据集合,节省内存>>> list = [1,2,3,4]>>> it = iter(list) # 创建迭代器对象>>> print(next(it)) # 输出迭代器的下一个元素1>>> print(next(it))2迭代器对象可以使用常规for语句进行遍历: list=[1,2,3,4]it = iter(list) # 创建迭代器对象for x in it: print (x)执行以上程序,输出结果如下: 1234也可以使用 next() 函数: import sys # 引入 sys 模块 list=[1,2,3,4]it = iter(list) # 创建迭代器对象 while True: try: print (next(it)) except StopIteration: sys.exit() 执行以上程序,输出结果如下: 1234凡是能够用for循环遍历的数据结构和对象统统可以称为可迭代的,即Iterable。我们现在接触到Iterable数据结构有list、tuple、dict、string、set,还有生成器generator(下面将讲到)。 但是,他们之间有什么区别呢?generator不但可以使用for循环,还可以被next()函数不断调用并返回下一个值,直到返回StopIteration错误。 能够被next()函数不断调用并返回下一个值的对象称为迭代器Iterator。generator是Iterable,同时也是一个Iterator;而list、tuple、str、dict不是Iterator。 当然,可以通过isinstance()判断一个对象是否为Iterator。 >>> from collections import Iterator>>> isinstance((x*x for x in range(10)), Iterator)True>>> isinstance([],Iterator)False>>> isinstance({},Iterator)False>>> isinstance("ABC",Iterator)False 如果想让list、tuple、str、dict等Iterable对象转变成Iterator,用iter()函数能够让Iterable对象变为Iterator >>> isinstance(iter("ABC"),Iterator)True>>> i = iter("ABC")>>> next(i)‘A‘>>> next(i)‘B‘>>> next(i)‘C‘ Iterable和Iterator对象到底有什么区别呢? 实际上,python中Iterator对象表示的是一个数据流,Iterator对象可以被next()函数不断调用返回下一个值,直到数据全部被返回。Iterator对象数据流可以被看作是一个序列,但是这个序列的长度是不可提前预知的,因为只能通过next()或者for循环按照需要调用下一个数据,所以Iterator对象的计算是一种惰性计算。 正是因为这样的特性,Iterator可以表示一个无限大的数据流,譬如全体自然数,而list是无法完成这样的任务的。 列表生成式 在讲到生成器之前我们先来讲一下列表生成式 列表生成式,顾名思义,就是用来生成列表的。以前我们生成列表的时候,一般都是先定义一个list = [] ,再用for循环将元素一个一个append到list中。 简单列表的生成,可以使用list(range(1,100)),那么如果需要生成[1*1,2*2,3*3....]呢? >>> [x*x for x in range(10)][0, 1, 4, 9, 16, 25, 36, 49, 64, 81]同时,还可以添加一些更多的要素,判断使用符合要求的x参与计算。 >>> [x*x for x in range(10) if x%2==0][0, 4, 16, 36, 64]使用多重循环还可以生成全排列 >>> [x+y for x in ‘ABC‘ for y in ‘LMN‘][‘AL‘, ‘AM‘, ‘AN‘, ‘BL‘, ‘BM‘, ‘BN‘, ‘CL‘, ‘CM‘, ‘CN‘]>>>>>> [x+y+z for x in ‘ABC‘ for y in ‘LMN‘ for z in ‘OPQ‘ if z==‘Q‘][‘ALQ‘, ‘AMQ‘, ‘ANQ‘, ‘BLQ‘, ‘BMQ‘, ‘BNQ‘, ‘CLQ‘, ‘CMQ‘, ‘CNQ‘]生成器 通过列表生成器,我们可以创造一个列表。但是,受到内存容量的限制,列表的容量肯定是有限的,如若我们只需要使用列表中的一部分,就不需要一下子生成很大的列表,直接按需生成就好了,列表生成器就提供了这样的功能。 生成器相当于是一个生成列表元素的算法,有了这个算法,就不用一下子生成很多元素了,只需要在需要的时候生成就可以了,节省了很多空间。在Python中,这种一边循环一遍计算的机制,称为:generator。 创建一个generator只需要把列表生成器的[]改成()就可以了。 >>> [x*x for x in range(10)][0, 1, 4, 9, 16, 25, 36, 49, 64, 81]>>> (x*x for x in range(10))<generator object <genexpr> at 0x00000259A50BD308>获取generator里面的元素,可以使用next()函数生成generator的下一个元素。 >>> g=(x*x for x in range(10))>>> next(g)0>>> next(g)1>>> next(g)4...>>> next(g)81>>> next(g)Traceback (most recent call last): File "<stdin>", line 1, in <module>StopIteration 一直调用next()函数就可以遍历generator的所有元素,直到抛出StopIteration错误。 但是最常用的当然还是for循环,毕竟generator也是Iterator的对象。 >>> g=(x*x for x in range(5))>>> for element in g:... print(element)...014916 一般我们创建一个generator后,基本上不会调用next(),而是通过for循环来迭代它,并且不需要关心StopIteration的错误。 有时候,推算元素的算法很复杂,并不能通过列表生成器实现,而需要通过函数打印出来,譬如菲波那切数列。 #!/usr/bin/env python def fib(Max): n = 0 a,b = 0,1 while n < Max: print(b) a,b = b,a+b n = n + 1 fib(5) 结果:11235 在Python中,使用了yield的函数被称为生成器(generator)。 跟普通函数不同的是,生成器是一个返回迭代器的函数,只能用于迭代操作,更简单点理解生成器就是一个迭代器。 在调用生成器运行的过程中,每次遇到yield时函数会暂停并保存当前所有灯运行信息,返回yield的值。并在下一次执行next()方法时从当前位置继续运行。 #!/usr/bin/env python def fib(Max): n = 0 a,b = 0,1 while n < Max: yield b a,b = b,a+b n = n + 1 g = fib(5)print(next(g))print(next(g))for i in g: print(i) 结果:11235 在函数的执行过程中,遇到return才会返回,但是变成了generator的函数,遇到了yield就会中断,并且返回yield的参数。 那么,遇到了yield就会中断并返回,我们能不能通过yield传一些参数进去呢? #!/usr/bin/env python def fib(Max): n = 0 a,b = 0,1 while n < Max: e = yield b print(e) a,b = b,a+b n = n + 1 g = fib(5)print(next(g))print(next(g))print(g.send("the third element"))print(g.send("forth")) 结果:1None1the third element2forth3 在上面的generator定义中,使用了e = yield b语句,这样遇到yield返回b的同时,还能够通过g.send(arg)传入一个参数赋值给e,这样,就可以通过generator进行参数传递了。 >>> def fib(Max):... n = 0... a,b = 0,1... while n < Max:... e = yield b... print(e)... a,b = b,a+b... n = n + 1...>>> g = fib(5)>>> g.send("the first element")Traceback (most recent call last): File "<stdin>", line 1, in <module>TypeError: can‘t send non-None value to a just-started generator>>> g.send(None)1 注意,看上面的代码,为什么会报错?说明启动一个generator的时候,只能传入None作为参数,而generator就相当于next(g)! 2.装饰器 原则:1、不能修改被装饰函数的源代码。2、不能修改被装饰函数的调用方式。3、不能改变被装饰函数的执行结果。装饰器对被装饰函数是透明的。 如何理解装饰器1、函数即“变量”2、高阶函数a:把一个函数名作为实参传递给另外一个函数b:返回值中包含函数名3、嵌套函数在一个函数体内声明另一个函数称为函数的嵌套 参考链接:http://www.liaoxuefeng.com/wiki/0014316089557264a6b348958f449949df42a6d3a2e542c000/0014318435599930270c0381a3b44db991cd6d858064ac0000 装饰器(decorator)是一种高级的Python语法。装饰器可以对一个函数,方法或者类加工。 由于函数也是一个对象,而且函数对象可以被赋值给变量,所以,通过变量也能调用该函数。 >>> def now():... print(‘2017-05-01‘)...>>> f = now>>> f()2017-05-01函数对象有一个__name__属性,可以拿到函数的名字: >>> now.__name__‘now‘>>> f.__name__‘now‘现在,假设我们要增强now()函数的功能。比如,在函数调用前后自动打印日志,但是又不希望修改now()函数的定义,这种在代码运行期间动态增加功能的方式,就称之为:装饰器(decorator)。 本质上,decorator就是一个返回函数的高阶函数。所以,我们要定义一个能打印日志的decorator,可以定义如下: def log(func): def wrapper(*args, **kwargs): print("call %s():" % func.__name__) return func(*args, **kwargs) return wrapper观察上面的log,因为它是一个decorator,所以接受一个函数作为参数,并返回一个函数。我们要借助Python的@语法,吧decorator置于函数的定义处: @log # 把这句放在这儿就相当于执行了 now = log(now)def now(): print("2017-05-01")调用now()函数,不仅会运行now()函数本身,还会运行now()函数前打印一行日志: >>> now()call now():2017-05-01把@log放在now()函数的定义处,就相当于执行了语句: now = log( now )由于log()是一个decorator,返回一个函数,所以,原来的now()函数仍然存在,只是现在同名的now变量指向了新的函数,于是调用now()将执行新函数,即在log()函数中返回的wrapper()函数。 如果decorator本身需要传入参数,那就需要编写一个返回decorator的高阶函数,写出来会更复杂。比如,要自定义log的文本: >>> def log(text):... def decorator(func):... def wrapper(*args, **kwargs):... print("%s %s():" % (text, func.__name__))... return func(*args, **kwargs)... return wrapper... return decorator...>>> @log("execute")... def now():... print("2017-05-01")...>>> now()execute now():2017-05-01 和两层嵌套的decorator相比,3层嵌套的效果是这样的: >>> now = log("execute")(now)我们来剖析上面的语句,首先执行log(‘execute‘),返回的是的decorator函数,在调用返回的函数,参数是now函数,返回值最终是wrapper函数。 以上两种decorator的定义都没有问题,但还差最后一步。因为我们讲了函数也是对象。它有__name__等属性,但你去看经过decorator装饰之后的函数,它们的__name__已经从原来的‘now‘变成了‘wrapper‘: >>> now.__name__‘wrapper‘因为返回的那个wrapper()函数名字就是‘wrapper‘,所以,需要把原始函数的__name__等属性复制到wrapper()函数中,否则,有些依赖函数签名的代码执行就会出错。 不需要编写wrapper.__name__ = func.__name__这样的代码,Python内置的functools.wraps就是干这个事的,所以,一个完整的decorator的写法如下: import functools def log(func): @functools.wraps(func) def wrapper(*args, **kw): print(‘call %s():‘ % func.__name__) return func(*args, **kw) return wrapper @log("execute")def now(): print("2017-05-01") now() 或者针对带参数的decorator: import functools def log(text): def decorator(func): @functools.wraps(func) def wrapper(*args, **kwargs): print("%s %s():" % (text, func.__name__)) return func(*args, **kwargs) return wrapper return decorator @log("execute")def now(): print("2017-05-01") now() 装饰器小结: 在面向对象(OOP)的设计模式中,decorator被称为装饰模式。OOP的装饰模式需要通过继承和组合来实现,而Python除了能支持OOP的decorator外,直接从语法层次支持decorator(面向对象后面学到)。Python的decorator可以用函数实现,也可以用类实现。 decorator可以增强函数的功能,定义起来虽然有点复杂,但使用起来非常灵活和方便。
时间: 2024-10-08 20:49:38