Python3之itertools模块

Python的内建模块itertools提供了非常有用的用于操作迭代对象的函数。

1、Infinite Iterators

Iterator Arguments Results Example

count()


start, [step]


start, start+step, start+2*step, ...


count(10) --> 10 11 12 13 14 ...


cycle()


p


p0, p1, ... plast, p0, p1, ...


cycle(‘ABCD‘) --> A B C D A B C D ...


repeat()


elem [,n]


elem, elem, elem, ... endlessly or up to n times


repeat(10, 3) --> 10 10 10  

1.1 count

  创建一个迭代器,生成从n开始的连续整数,如果忽略n,则从0开始计算(注意:此迭代器不支持长整数)

如果超出了sys.maxint,计数器将溢出并继续从-sys.maxint-1开始计算。 

>>> import itertools
>>> n = itertools.count(1)
>>> for i in n:
	print(i)

1
2
3
4
......

1.2 cycle

  传入一个序列,无限循环下去:  

>>> itertools.cycle(‘ABCDE‘)
<itertools.cycle object at 0x00000000033576C8>
>>> for i in itertools.cycle(‘ABCDE‘):
	print(i)

A
B
C
D
E
A
B
.....

1.3 repeat

  创建一个迭代器,重复生成object,times(如果已提供)指定重复计数,如果未提供times,将无止尽返回该对象。

>>> s = itertools.repeat(‘ABC‘,4)
>>> s
repeat(‘ABC‘, 4)
>>> for i in s:
	print(i)

ABC
ABC
ABC
ABC
>>>

  

2、Iterators terminating on the shortest input sequence


Iterator


Arguments


Results


Example


accumulate()


p [,func]


p0, p0+p1, p0+p1+p2, ...


accumulate([1,2,3,4,5]) --> 1 3 6 10 15


chain()


p, q, ...


p0, p1, ... plast, q0, q1, ...


chain(‘ABC‘, ‘DEF‘) --> A B C D E F


chain.from_iterable()


iterable


p0, p1, ... plast, q0, q1, ...


chain.from_iterable([‘ABC‘, ‘DEF‘]) --> A B C DE F


compress()


data, selectors


(d[0] if s[0]), (d[1] if s[1]), ...


compress(‘ABCDEF‘, [1,0,1,0,1,1]) --> A C E F


dropwhile()


pred, seq


seq[n], seq[n+1], starting when pred fails


dropwhile(lambda x: x<5, [1,4,6,4,1]) --> 6 4 1


filterfalse()


pred, seq


elements of seq where pred(elem) is false


filterfalse(lambda x: x%2, range(10)) --> 0 2 46 8


groupby()


iterable[, keyfunc]


sub-iterators grouped by value of keyfunc(v)


islice()


seq, [start,] stop [, step]


elements from seq[start:stop:step]


islice(‘ABCDEFG‘, 2, None) --> C D E F G


starmap()


func, seq


func(*seq[0]), func(*seq[1]), ...


starmap(pow, [(2,5), (3,2), (10,3)]) --> 32 91000


takewhile()


pred, seq


seq[0], seq[1], until pred fails


takewhile(lambda x: x<5, [1,4,6,4,1]) --> 1 4


tee()


it, n


it1, it2, ... itn splits one iterator into n


zip_longest()


p, q, ...


(p[0], q[0]), (p[1], q[1]), ...


zip_longest(‘ABCD‘, ‘xy‘, fillvalue=‘-‘) --> AxBy C- D-

2.1 chain

  将多个迭代器作为参数, 但只返回单个迭代器, 它产生所有参数迭代器的内容, 就好像他们是来自于一个单一的序列.  

>>> for c in itertools.chain(‘ABC‘, ‘XYZ‘):
...     print(c)
# 迭代效果:‘A‘ ‘B‘ ‘C‘ ‘X‘ ‘Y‘ ‘Z‘

2.2 groupby

  返回一个产生按照key进行分组后的值集合的迭代器.

  如果iterable在多次连续迭代中生成了同一项,则会定义一个组,如果将此函数应用一个分类列表,那么分组将定义该列表中的所有唯一项,key(如果已提供)是一个函数,应用于每一项,如果此函数存在返回值,该值将用于后续项而不是该项本身进行比较,此函数返回的迭代器生成元素(key, group),其中key是分组的键值,group是迭代器,生成组成该组的所有项。 

>>> for key, group in itertools.groupby(‘AAABBBCCAAA‘):
...     print(key, list(group))
...
A [‘A‘, ‘A‘, ‘A‘]
B [‘B‘, ‘B‘, ‘B‘]
C [‘C‘, ‘C‘]
A [‘A‘, ‘A‘, ‘A‘]

  实际上挑选规则是通过函数完成的,只要作用于函数的两个元素返回的值相等,这两个元素就被认为是在一组的,而函数返回值作为组的key。如果我们要忽略大小写分组,就可以让元素‘A‘‘a‘都返回相同的key:

>>> for key, group in itertools.groupby(‘AaaBBbcCAAa‘, lambda c: c.upper()):
...     print(key, list(group))
...
A [‘A‘, ‘a‘, ‘a‘]
B [‘B‘, ‘B‘, ‘b‘]
C [‘c‘, ‘C‘]
A [‘A‘, ‘A‘, ‘a‘]

  

3、Combinatoric generators 


Iterator


Arguments


Results


product()


p, q, ... [repeat=1]


cartesian product, equivalent to a nested for-loop


permutations()


p[, r]


r-length tuples, all possible orderings, no repeated elements


combinations()


p, r


r-length tuples, in sorted order, no repeated elements


combinations_with_replacement()


p, r


r-length tuples, in sorted order, with repeated elements


product(‘ABCD‘, repeat=2)


AA AB AC AD BA BB BC BD CA CB CC CD DA DB DC DD


permutations(‘ABCD‘, 2)


AB AC AD BA BC BD CA CB CD DA DB DC


combinations(‘ABCD‘, 2)


AB AC AD BC BD CD


combinations_with_replacement(‘ABCD‘, 2)


AA AB AC AD BB BC BD CC CD DD

3.1 product(*iterables[, repeat]) 笛卡尔积

  创建一个迭代器,生成表示item1,item2等中的项目的笛卡尔积的元组,repeat是一个关键字参数,指定重复生成序列的次数。 

>>> a = (1,2,3)
>>> b = (‘A‘,‘B‘,‘C‘)
>>> c = itertools.product(a,b)
>>> for i in c:
	print(i)

(1, ‘A‘)
(1, ‘B‘)
(1, ‘C‘)
(2, ‘A‘)
(2, ‘B‘)
(2, ‘C‘)
(3, ‘A‘)
(3, ‘B‘)
(3, ‘C‘)  

3.2 permutations(iterable[, r]) 排列

  创建一个迭代器,返回iterable中所有长度为r的项目序列,如果省略了r,那么序列的长度与iterable中的项目数量相同: 返回p中任意取r个元素做排列的元组的迭代器 

>>> a = [1, 2, 3, 4]
>>> s = [i for i in itertools.permutations(a,3)] # 从序列a中选出3个元素进行排列
>>> s
[(1, 2, 3), (1, 2, 4), (1, 3, 2), (1, 3, 4), (1, 4, 2), (1, 4, 3), (2, 1, 3), (2, 1, 4), (2, 3, 1), (2, 3, 4), (2, 4, 1), (2, 4, 3), (3, 1, 2), (3, 1, 4), (3, 2, 1), (3, 2, 4), (3, 4, 1), (3, 4, 2), (4, 1, 2), (4, 1, 3), (4, 2, 1), (4, 2, 3), (4, 3, 1), (4, 3, 2)]
>>> s_number = [i[0]*100 + i[1]*10 + i[2] for i in s]  # 选出的3个数字组合成不重复的3位数
>>> s_number
[123, 124, 132, 134, 142, 143, 213, 214, 231, 234, 241, 243, 312, 314, 321, 324, 341, 342, 412, 413, 421, 423, 431, 432]
>>>

3.3 combinations(iterable, r) 组合

  创建一个迭代器,返回iterable中所有长度为r的子序列,返回的子序列中的项按输入iterable中的顺序排序 (不带重复)

>>> a = [1, 2, 3, 4]
>>> s = [i for i in itertools.combinations(a,2)] # 从序列a中选出2个不重复的元素
>>> s
[(1, 2), (1, 3), (1, 4), (2, 3), (2, 4), (3, 4)]

更多详细信息请查看官网介绍:https://docs.python.org/3.5/library/itertools.html

时间: 2024-08-06 05:43:23

Python3之itertools模块的相关文章

Python3 内建模块 hashlib、itertools、HTMLParser、urllib

Python的hashlib提供了常见的摘要算法,如MD5,SHA1等等. 什么是摘要算法呢?摘要算法又称哈希算法.散列算法.它通过一个函数,把任意长度的数据转换为一个长度固定的数据串(通常用16进制的字符串表示). 举个例子,你写了一篇文章,内容是一个字符串'how to use python hashlib - by Michael',并附上这篇文章的摘要是'2d73d4f15c0db7f5ecb321b6a65e5d6d'.如果有人篡改了你的文章,并发表为'how to use pytho

Python3.x标准模块库目录

Python3.x标准模块库目录 文本 1. string:通用字符串操作 2. re:正则表达式操作 3. difflib:差异计算工具 4. textwrap:文本填充 5. unicodedata:Unicode字符数据库 6. stringprep:互联网字符串准备工具 7. readline:GNU按行读取接口 8. rlcompleter:GNU按行读取的实现函数 二进制数据 9. struct:将字节解析为打包的二进制数据 10. codecs:注册表与基类的编解码器 数据类型 1

python基础系列教程——Python3.x标准模块库目录

python基础系列教程——Python3.x标准模块库目录 文本 string:通用字符串操作 re:正则表达式操作 difflib:差异计算工具 textwrap:文本填充 unicodedata:Unicode字符数据库 stringprep:互联网字符串准备工具 readline:GNU按行读取接口 rlcompleter:GNU按行读取的实现函数 二进制数据 struct:将字节解析为打包的二进制数据 codecs:注册表与基类的编解码器 数据类型 datetime:基于日期与时间工具

Python:itertools模块

itertools模块包含创建有效迭代器的函数,可以用各种方式对数据进行循环操作,此模块中的所有函数返回的迭代器都可以与for循环语句以及其他包含迭代器(如生成器和生成器表达式)的函数联合使用. chain(iter1, iter2, ..., iterN): 给出一组迭代器(iter1, iter2, ..., iterN),此函数创建一个新迭代器来将所有的迭代器链接起来,返回的迭代器从iter1开始生成项,知道iter1被用完,然后从iter2生成项,这一过程会持续到iterN中所有的项都被

itertools模块

itertools模块概览 +生成无限迭代器 count(start, [step]) #从start开始,步长为step的无限整数迭代器(step默认值为1) cycle(iterable) #不断循环iterable而得到的无限迭代器 repeat(object, [n]) #重复object对象n次生成的迭代器 (n默认值为无穷大) +处理输入序列得到新的迭代器 chain(*iterables)             #将多个序列串联 compress(data, selectors)

python itertools模块练习

参考 <python标准库> 也可以参考Vamei博客 列表用着很舒服,但迭代器不需要将所有数据同时存储在内存中. 本章练习一下python 标准库中itertools模块 合并 和 分解 迭代器 1.chain() 处理多个序列,而不比构造一个大的,两个合在一起,遍历就好了 >>> for i in chain(range(3),range(5,9)): ... print i ... 0 1 2 5 6 7 8 >>> 2.izip() 类似zip,可以

python3使用csv模块读写csv文件

python3使用csv模块读写csv文件 读取csv文件: import csv #打开文件,用with打开可以不用去特意关闭file了,python3不支持file()打开文件,只能用open() with open("XXX.csv","r",encoding="utf-8") as csvfile: #读取csv文件,返回的是迭代类型 read = csv.reader(csvfile) for i in read: print(i) 存

PYTHON-进阶-ITERTOOLS模块

PYTHON-进阶-ITERTOOLS模块小结 这货很强大, 必须掌握 文档 链接 pymotw 链接 基本是基于文档的翻译和补充,相当于翻译了 itertools用于高效循环的迭代函数集合 组成 总体,整体了解 无限迭代器 迭代器 参数 结果 例子 count() start, [step] start, start+step, start+2*step, ... count(10) --> 10 11 12 13 14 ... cycle() p p0, p1, ... plast, p0,

python中itertools模块介绍---01

itertools模块中包含了很多函数,这些函数最终都生成一个或多个迭代器,下面对这些函数进行介绍: 为了能够使用itertools中的函数,需要将该模块导入: >>>from itertools import * count(start=0,step=1): 源代码为: def count(start=0,step=1):     n=start     while True:         yield n         n+=step 从源代码可以看出,count函数产生一个生成