Python中itertools模块用法详解
本文实例讲述了Python中itertools模块用法,分享给大家供大家参考。具体分析如下:
一般来说,itertools模块包含创建有效迭代器的函数,可以用各种方式对数据进行循环操作,此模块中的所有函数返回的迭代器都可以与for循环语句以及其他包含迭代器(如生成器和生成器表达式)的函数联合使用。
chain(iter1,iter2,...,iterN):
给出一组迭代器(iter1,iter2,...,iterN),此函数创建一个新迭代器来将所有的迭代器链接起来,返回的迭代器从iter1开始生成项,知道iter1被用完,然后从iter2生成项,这一过程会持续到iterN中所有的项都被用完。
fromitertoolsimportchain
test=chain('AB','CDE','F')
forelintest:
printel
A
B
C
D
E
F
chain.from_iterable(iterables):
一个备用链构造函数,其中的iterables是一个迭代变量,生成迭代序列,此操作的结果与以下生成器代码片段生成的结果相同:
>>>deff(iterables):
forxiniterables:
foryinx:
yieldy
>>>test=f('ABCDEF')
>>>test.next()
'A'
>>>fromitertoolsimportchain
>>>test=chain.from_iterable('ABCDEF')
>>>test.next()
'A'
combinations(iterable,r):
创建一个迭代器,返回iterable中所有长度为r的子序列,返回的子序列中的项按输入iterable中的顺序排序:
>>>fromitertoolsimportcombinations >>>test=combinations([1,2,3,4],2) >>>forelintest: printel (1,2) (1,3) (1,4) (2,3) (2,4) (3,4)
count([n]):
创建一个迭代器,生成从n开始的连续整数,如果忽略n,则从0开始计算(注意:此迭代器不支持长整数),如果超出了sys.maxint,计数器将溢出并继续从-sys.maxint-1开始计算。
cycle(iterable):
创建一个迭代器,对iterable中的元素反复执行循环操作,内部会生成iterable中的元素的一个副本,此副本用于返回循环中的重复项。
dropwhile(predicate,iterable):
创建一个迭代器,只要函数predicate(item)为True,就丢弃iterable中的项,如果predicate返回False,就会生成iterable中的项和所有后续项。
defdropwhile(predicate,iterable): #dropwhile(lambdax:x<5,[1,4,6,4,1])-->641 iterable=iter(iterable) forxiniterable: ifnotpredicate(x): yieldx break forxiniterable: yieldx
groupby(iterable[,key]):
创建一个迭代器,对iterable生成的连续项进行分组,在分组过程中会查找重复项。
如果iterable在多次连续迭代中生成了同一项,则会定义一个组,如果将此函数应用一个分类列表,那么分组将定义该列表中的所有唯一项,key(如果已提供)是一个函数,应用于每一项,如果此函数存在返回值,该值将用于后续项而不是该项本身进行比较,此函数返回的迭代器生成元素(key,group),其中key是分组的键值,group是迭代器,生成组成该组的所有项。
ifilter(predicate,iterable):
创建一个迭代器,仅生成iterable中predicate(item)为True的项,如果predicate为None,将返回iterable中所有计算为True的项。
ifilter(lambdax:x%2,range(10))-->13579
ifilterfalse(predicate,iterable):
创建一个迭代器,仅生成iterable中predicate(item)为False的项,如果predicate为None,则返回iterable中所有计算为False的项。
ifilterfalse(lambdax:x%2,range(10))-->02468
imap(function,iter1,iter2,iter3,...,iterN)
创建一个迭代器,生成项function(i1,i2,...,iN),其中i1,i2...iN分别来自迭代器iter1,iter2...iterN,如果function为None,则返回(i1,i2,...,iN)形式的元组,只要提供的一个迭代器不再生成值,迭代就会停止。
>>>fromitertoolsimport* >>>d=imap(pow,(2,3,10),(5,2,3)) >>>foriind:printi 32 9 1000 #### >>>d=imap(pow,(2,3,10),(5,2)) >>>foriind:printi 32 9 #### >>>d=imap(None,(2,3,10),(5,2)) >>>foriind:printi (2,5) (3,2)
islice(iterable,[start,]stop[,step]):
创建一个迭代器,生成项的方式类似于切片返回值:iterable[start:stop:step],将跳过前start个项,迭代在stop所指定的位置停止,step指定用于跳过项的步幅。与切片不同,负值不会用于任何start,stop和step,如果省略了start,迭代将从0开始,如果省略了step,步幅将采用1.
defislice(iterable,*args):
#islice('ABCDEFG',2)-->AB
#islice('ABCDEFG',2,4)-->CD
#islice('ABCDEFG',2,None)-->CDEFG
#islice('ABCDEFG',0,None,2)-->ACEG
s=slice(*args)
it=iter(xrange(s.startor0,s.stoporsys.maxint,s.stepor1))
nexti=next(it)
fori,elementinenumerate(iterable):
ifi==nexti:
yieldelement
nexti=next(it)
#IfstartisNone,theniterationstartsatzero.IfstepisNone,thenthestepdefaultstoone.
#Changedinversion2.5:acceptNonevaluesfordefaultstartandstep.
izip(iter1,iter2,...iterN):
创建一个迭代器,生成元组(i1,i2,...iN),其中i1,i2...iN分别来自迭代器iter1,iter2...iterN,只要提供的某个迭代器不再生成值,迭代就会停止,此函数生成的值与内置的zip()函数相同。
defizip(*iterables):
#izip('ABCD','xy')-->AxBy
iterables=map(iter,iterables)
whileiterables:
yieldtuple(map(next,iterables))
izip_longest(iter1,iter2,...iterN,[fillvalue=None]):
与izip()相同,但是迭代过程会持续到所有输入迭代变量iter1,iter2等都耗尽为止,如果没有使用fillvalue关键字参数指定不同的值,则使用None来填充已经使用的迭代变量的值。
defizip_longest(*args,**kwds):
#izip_longest('ABCD','xy',fillvalue='-')-->AxByC-D-
fillvalue=kwds.get('fillvalue')
defsentinel(counter=([fillvalue]*(len(args)-1)).pop):
yieldcounter()#yieldsthefillvalue,orraisesIndexError
fillers=repeat(fillvalue)
iters=[chain(it,sentinel(),fillers)foritinargs]
try:
fortupinizip(*iters):
yieldtup
exceptIndexError:
pass
permutations(iterable[,r]):
创建一个迭代器,返回iterable中所有长度为r的项目序列,如果省略了r,那么序列的长度与iterable中的项目数量相同:
defpermutations(iterable,r=None):
#permutations('ABCD',2)-->ABACADBABCBDCACBCDDADBDC
#permutations(range(3))-->012021102120201210
pool=tuple(iterable)
n=len(pool)
r=nifrisNoneelser
ifr>n:
return
indices=range(n)
cycles=range(n,n-r,-1)
yieldtuple(pool[i]foriinindices[:r])
whilen:
foriinreversed(range(r)):
cycles[i]-=1
ifcycles[i]==0:
indices[i:]=indices[i+1:]+indices[i:i+1]
cycles[i]=n-i
else:
j=cycles[i]
indices[i],indices[-j]=indices[-j],indices[i]
yieldtuple(pool[i]foriinindices[:r])
break
else:
return
product(iter1,iter2,...iterN,[repeat=1]):
创建一个迭代器,生成表示item1,item2等中的项目的笛卡尔积的元组,repeat是一个关键字参数,指定重复生成序列的次数。
defproduct(*args,**kwds):
#product('ABCD','xy')-->AxAyBxByCxCyDxDy
#product(range(2),repeat=3)-->000001010011100101110111
pools=map(tuple,args)*kwds.get('repeat',1)
result=[[]]
forpoolinpools:
result=[x+[y]forxinresultforyinpool]
forprodinresult:
yieldtuple(prod)
repeat(object[,times]):
创建一个迭代器,重复生成object,times(如果已提供)指定重复计数,如果未提供times,将无止尽返回该对象。
defrepeat(object,times=None): #repeat(10,3)-->101010 iftimesisNone: whileTrue: yieldobject else: foriinxrange(times): yieldobject
starmap(func[,iterable]):
创建一个迭代器,生成值func(*item),其中item来自iterable,只有当iterable生成的项适用于这种调用函数的方式时,此函数才有效。
defstarmap(function,iterable): #starmap(pow,[(2,5),(3,2),(10,3)])-->3291000 forargsiniterable: yieldfunction(*args)
takewhile(predicate[,iterable]):
创建一个迭代器,生成iterable中predicate(item)为True的项,只要predicate计算为False,迭代就会立即停止。
deftakewhile(predicate,iterable): #takewhile(lambdax:x<5,[1,4,6,4,1])-->14 forxiniterable: ifpredicate(x): yieldx else: break
tee(iterable[,n]):
从iterable创建n个独立的迭代器,创建的迭代器以n元组的形式返回,n的默认值为2,此函数适用于任何可迭代的对象,但是,为了克隆原始迭代器,生成的项会被缓存,并在所有新创建的迭代器中使用,一定要注意,不要在调用tee()之后使用原始迭代器iterable,否则缓存机制可能无法正确工作。
deftee(iterable,n=2): it=iter(iterable) deques=[collections.deque()foriinrange(n)] defgen(mydeque): whileTrue: ifnotmydeque:#whenthelocaldequeisempty newval=next(it)#fetchanewvalueand fordindeques:#loadittoallthedeques d.append(newval) yieldmydeque.popleft() returntuple(gen(d)fordindeques) #Oncetee()hasmadeasplit,theoriginaliterableshouldnotbeusedanywhereelse;otherwise, theiterablecouldgetadvancedwithouttheteeobjectsbeinginformed. #Thisitertoolmayrequiresignificantauxiliarystorage(dependingonhowmuchtemporarydataneedstobestored). Ingeneral,ifoneiteratorusesmostorallofthedatabeforeanotheriteratorstarts,itisfastertouselist()insteadoftee().
相信本文所述对大家Python程序设计的学习有一定的借鉴价值。