详解Python中的分组函数groupby和itertools）

2023-09-10 10:10:05 439

fromoperatorimportitemgetter#itemgetter用来去dict中的key，省去了使用lambda函数 fromitertoolsimportgroupby#itertool还包含有其他很多函数，比如将多个list联合起来。。 d1={'name':'zhangsan','age':20,'country':'China'} d2={'name':'wangwu','age':19,'country':'USA'} d3={'name':'lisi','age':22,'country':'JP'} d4={'name':'zhaoliu','age':22,'country':'USA'} d5={'name':'pengqi','age':22,'country':'USA'} d6={'name':'lijiu','age':22,'country':'China'} lst=[d1,d2,d3,d4,d5,d6] #通过country进行分组： lst.sort(key=itemgetter('country'))#需要先排序，然后才能groupby。lst排序后自身被改变 lstg=groupby(lst,itemgetter('country')) #lstg=groupby(lst,key=lambdax:x['country'])等同于使用itemgetter() forkey,groupinlstg: forgingroup:#group是一个迭代器，包含了所有的分组列表 printkey,g

China{'country':'China','age':20,'name':'zhangsan'} China{'country':'China','age':22,'name':'lijiu'} JP{'country':'JP','age':22,'name':'lisi'} USA{'country':'USA','age':19,'name':'wangwu'} USA{'country':'USA','age':22,'name':'zhaoliu'} USA{'country':'USA','age':22,'name':'pengqi'} print[keyforkey,groupinlstg]#返回：['China','JP','USA'] print[(key,list(group))forkey,groupinlstg] #返回的list中包含着三个元组： [('China',[{'country':'China','age':20,'name':'zhangsan'},{'country':'China','age':22,'name':'lijiu'}]),('JP',[{'country':'JP','age':22,'name':'lisi'}]),('USA',[{'country':'USA','age':19,'name':'wangwu'},{'country':'USA','age':22,'name':'zhaoliu'},{'country':'USA','age':22,'name':'pengqi'}])] printdict([(key,list(group))forkey,groupinlstg]) #返回的是一个字典： {'JP':[{'country':'JP','age':22,'name':'lisi'}],'China':[{'country':'China','age':20,'name':'zhangsan'},{'country':'China','age':22,'name':'lijiu'}],'USA':[{'country':'USA','age':19,'name':'wangwu'},{'country':'USA','age':22,'name':'zhaoliu'},{'country':'USA','age':22,'name':'pengqi'}]} printdict([(key,len(list(group)))forkey,groupinlstg]) #返回每个分组的个数： {'JP':1,'China':2,'USA':3} #返回包含有2个以上元素的分组 print[keyforkey,groupingroupby(sorted(lst,key=itemgetter('country')),itemgetter('country'))iflen(list(group))>=2] #返回：['China','USA'] lstg=groupby(sorted(lst,key=itemgetter('country')),key=itemgetter('country')) lstgall=[(key,list(group))forkey,groupinlstg] printdict(filter(lambdax:len(x[1])>2,lstgall)) #过滤出分组后的元素个数大于2个的分组，返回： {'USA':[{'country':'USA','age':19,'name':'wangwu'},{'country':'USA','age':22,'name':'zhaoliu'},{'country':'USA','age':22,'name':'pengqi'}]}

详解Python中的分组函数groupby和itertools）

热门推荐

随机推荐