Python中的分组函数(groupby、itertools)

from operator import itemgetter #itemgetter用来去dict中的key,省去了使用lambda函数
from itertools import groupby #itertool还包含有其他很多函数,比如将多个list联合起来。。
d1={‘name‘:‘zhangsan‘,‘age‘:20,‘country‘:‘China‘}
d2={‘name‘:‘wangwu‘,‘age‘:19,‘country‘:‘USA‘}
d3={‘name‘:‘lisi‘,‘age‘:22,‘country‘:‘JP‘}
d4={‘name‘:‘zhaoliu‘,‘age‘:22,‘country‘:‘USA‘}
d5={‘name‘:‘pengqi‘,‘age‘:22,‘country‘:‘USA‘}
d6={‘name‘:‘lijiu‘,‘age‘:22,‘country‘:‘China‘}
lst=[d1,d2,d3,d4,d5,d6]

#通过country进行分组:

lst.sort(key=itemgetter(‘country‘)) #需要先排序,然后才能groupby。lst排序后自身被改变
lstg = groupby(lst,itemgetter(‘country‘))
#lstg = groupby(lst,key=lambda x:x[‘country‘]) 等同于使用itemgetter()

for key,group in lstg:
    for g in group: #group是一个迭代器,包含了所有的分组列表
        print key,g
返回:
China {‘country‘: ‘China‘, ‘age‘: 20, ‘name‘: ‘zhangsan‘}
China {‘country‘: ‘China‘, ‘age‘: 22, ‘name‘: ‘lijiu‘}
JP {‘country‘: ‘JP‘, ‘age‘: 22, ‘name‘: ‘lisi‘}
USA {‘country‘: ‘USA‘, ‘age‘: 19, ‘name‘: ‘wangwu‘}
USA {‘country‘: ‘USA‘, ‘age‘: 22, ‘name‘: ‘zhaoliu‘}
USA {‘country‘: ‘USA‘, ‘age‘: 22, ‘name‘: ‘pengqi‘}

print [key for key,group in lstg] #返回:[‘China‘, ‘JP‘, ‘USA‘]

print [(key,list(group)) for key,group in lstg]
#返回的list中包含着三个元组:
[(‘China‘, [{‘country‘: ‘China‘, ‘age‘: 20, ‘name‘: ‘zhangsan‘}, {‘country‘: ‘China‘, ‘age‘: 22, ‘name‘: ‘lijiu‘}]), (‘JP‘, [{‘country‘: ‘JP‘, ‘age‘: 22, ‘name‘: ‘lisi‘}]), (‘USA‘, [{‘country‘: ‘USA‘, ‘age‘: 19, ‘name‘: ‘wangwu‘}, {‘country‘: ‘USA‘, ‘age‘: 22, ‘name‘: ‘zhaoliu‘}, {‘country‘: ‘USA‘, ‘age‘: 22, ‘name‘: ‘pengqi‘}])]

print dict([(key,list(group)) for key,group in lstg])
#返回的是一个字典:
{‘JP‘: [{‘country‘: ‘JP‘, ‘age‘: 22, ‘name‘: ‘lisi‘}], ‘China‘: [{‘country‘: ‘China‘, ‘age‘: 20, ‘name‘: ‘zhangsan‘}, {‘country‘: ‘China‘, ‘age‘: 22, ‘name‘: ‘lijiu‘}], ‘USA‘: [{‘country‘: ‘USA‘, ‘age‘: 19, ‘name‘: ‘wangwu‘}, {‘country‘: ‘USA‘, ‘age‘: 22, ‘name‘: ‘zhaoliu‘}, {‘country‘: ‘USA‘, ‘age‘: 22, ‘name‘: ‘pengqi‘}]}

print dict([(key,len(list(group))) for key,group in lstg])
#返回每个分组的个数:
{‘JP‘: 1, ‘China‘: 2, ‘USA‘: 3}
#返回包含有2个以上元素的分组
print [key for key,group in groupby(sorted(lst,key=itemgetter(‘country‘)),itemgetter(‘country‘)) if len(list(group))>=2]
#返回:[‘China‘, ‘USA‘]
时间: 2024-10-13 16:29:34

Python中的分组函数(groupby、itertools)的相关文章

python中有趣的函数

filter(function, sequence):对sequence中的item依次执行function(item),将执行结果为True的item组成一个List/String/Tuple(取决于sequence的类型)返回: >>> def f(x): return x % 2 != 0 and x % 3 != 0 >>> filter(f, range(2, 25)) [5, 7, 11, 13, 17, 19, 23] >>> def f

举例详解Python中的split()函数的使用方法

这篇文章主要介绍了举例详解Python中的split()函数的使用方法,split()函数的使用是Python学习当中的基础知识,通常用于将字符串切片并转换为列表,需要的朋友可以参考下 函数:split() Python中有split()和os.path.split()两个函数,具体作用如下:split():拆分字符串.通过指定分隔符对字符串进行切片,并返回分割后的字符串列表(list)os.path.split():按照路径将文件名和路径分割开 一.函数说明1.split()函数语法:str.

Python中的getattr()函数详解:

Python中的getattr()函数详解: getattr(object, name[, default]) -> value Get a named attribute from an object; getattr(x, 'y') is equivalent to x.y. When a default argument is given, it is returned when the attribute doesn't exist; without it, an exception i

python中的map()函数

MapReduce的设计灵感来自于函数式编程,这里不打算提MapReduce,就拿python中的map()函数来学习一下. 文档中的介绍在这里: map(function, iterable, ...) Apply function to every item of iterable and return a list of the results. If additional iterable arguments are passed, function must take that man

python中的生成器函数是如何工作的?

以下内容基于python3.4 1. python中的普通函数是怎么运行的? 当一个python函数在执行时,它会在相应的python栈帧上运行,栈帧表示程序运行时函数调用栈中的某一帧.想要获得某个函数相关的栈帧,则必须在调用这个函数且这个函数尚未返回时获取,可能通过inspect模块的currentframe()函数获取当前栈帧. 栈帧对象中的3个常用的属性: f_back : 调用栈的上一级栈帧 f_code: 栈帧对应的c f_locals: 用在当前栈帧时的局部变量; 比如: >>&g

python进阶一(函数式编程)【2-2 python中的map函数】

2-2 python中的map()函数 python中map()函数 map()是 Python 内置的高阶函数,它接收一个函数 f 和一个 list,并通过把函数 f 依次作用在 list 的每个元素上,得到一个新的 list 并返回. 原文地址:https://www.cnblogs.com/ucasljq/p/11609544.html

python进阶一(函数式编程)【2-3 python中的reduce函数】

2-3 python中的reduce函数 python中reduce()函数 reduce()函数也是Python内置的一个高阶函数.reduce()函数接收的参数和 map()类似,一个函数 f,一个list,但行为和 map()不同,reduce()传入的函数 f 必须接收两个参数,reduce()对list的每个元素反复调用函数f,并返回最终结果值. 例如,编写一个f函数,接收x和y,返回x和y的和: 1 def f(x, y): 2 return x + y 调用 reduce(f, [

Python中关于Lambda函数的使用总结

lambda表达式是一种匿名函数,对应python中的自定义函数def,是定义某个函数时比较高级的一种写法.作为python初学者,本文整理了lambda的一些基本用法和特点. lambda和def的对应关系 定义func函数,计算给定数x的平方 def func(x): return x*x 等价于 func = lambda x: x*x 其中func是函数名,x是输入参数,x*x是输出结果 输入参数可以有多个,可以接收不定参数如*args或者**kwargs. f = lambda x,

Python中re模块函数使用介绍

Python中通过re模块实现了正则表达式的功能.re模块提供了一些根据正则表达式进行查找.替换.分隔字符串的函数.本文主要介绍re模块中常用的函数和函数常用场景. re模块常用函数 1.match(pattern,string,flags=0) 根据pattern从string的头部开始匹配字符串,只返回第1次匹配成功的对象,否则,返回None.flags表示规则选项. >>> import re >>> Str='Python:Java:C' >>>