Python进阶:生成器 懒人版本的迭代器详解
从容器、可迭代对象谈起
所有的容器都是可迭代的(iterable),迭代器提供了一个next方法。iter()返回一个迭代器,通过next()函数可以实现遍历。
defis_iterable(param): try: iter(param) returnTrue exceptTypeError: returnFalse params=[ 1234, '1234', [1,2,3,4], set([1,2,3,4]), {1:1,2:2,3:3,4:4}, (1,2,3,4) ] forparaminparams: print('{}isiterable?{}'.format(param,is_iterable(param))) ##########输出########## #1234isiterable?False #1234isiterable?True #[1,2,3,4]isiterable?True #{1,2,3,4}isiterable?True #{1:1,2:2,3:3,4:4}isiterable?True #(1,2,3,4)isiterable?True
除了数字外,其他数据结构都是可迭代的。
生成器是什么
生成器是懒人版本的迭代器。例:
importos importpsutil #显示当前python程序占用的内存大小 defshow_memory_info(hint): pid=os.getpid() p=psutil.Process(pid) info=p.memory_full_info() memory=info.uss/1024./1024 print('{}memoryused:{}MB'.format(hint,memory)) deftest_iterator(): show_memory_info('initingiterator') list_1=[iforiinrange(100000000)] show_memory_info('afteriteratorinitiated') print(sum(list_1)) show_memory_info('aftersumcalled') deftest_generator(): show_memory_info('initinggenerator') list_2=(iforiinrange(100000000)) show_memory_info('aftergeneratorinitiated') print(sum(list_2)) show_memory_info('aftersumcalled') test_iterator() test_generator() %timetest_iterator() %timetest_generator() #########输出########## initingiteratormemoryused:48.9765625MB afteriteratorinitiatedmemoryused:3920.30078125MB 4999999950000000 aftersumcalledmemoryused:3920.3046875MB Walltime:17s initinggeneratormemoryused:50.359375MB aftergeneratorinitiatedmemoryused:50.359375MB 4999999950000000 aftersumcalledmemoryused:50.109375MB Walltime:12.5s
[iforiinrange(100000000)]声明了一个迭代器,每个元素在生成后都会保存到内存中,占用了巨量的内存。(iforiinrange(100000000))初始化了一个生成器,可以看到,生成器并不会像迭代器一样占用大量的内存,相比于test_iterator(),test_generator()函数节省了一次生成一亿个元素的过程。在调用next()的时候,才会生成下一个变量.
生成器能玩啥花样
数学中有一个恒等式,(1+2+3+...+n)^2=1^3+2^3+3^3+...+n^3,用以下代码表达
defgenerator(k): i=1 whileTrue: yieldi**k i+=1 gen_1=generator(1) gen_3=generator(3) print(gen_1) print(gen_3) defget_sum(n): sum_1,sum_3=0,0 foriinrange(n): next_1=next(gen_1) next_3=next(gen_3) print('next_1={},next_3={}'.format(next_1,next_3)) sum_1+=next_1 sum_3+=next_3 print(sum_1*sum_1,sum_3) get_sum(8) ##########输出########## ## #next_1=1,next_3=1 #next_1=2,next_3=8 #next_1=3,next_3=27 #next_1=4,next_3=64 #next_1=5,next_3=125 #next_1=6,next_3=216 #next_1=7,next_3=343 #next_1=8,next_3=512 #12961296
generator()这个函数,它返回了一个生成器,当运行到yieldi**k时,暂停并把i**k作为next()的返回值。每次调用next(gen)时,暂停的程序会启动并往下执行,而且i的值也会被记住,继续累加,最后next_1为8,next_3为512.
仔细查看这个示例,发现迭代器是一个有限集合,生成器则可以成为一个无限集。调用next(),生成器根据运算会自动生成新的元素,然后返回给你,非常便捷。
再来看一个问题:给定一个list和一个指定数字,求这个数字在list中的位置:
#常规写法 defindex_normal(L,target): result=[] fori,numinenumerate(L): ifnum==target: result.append(i) returnresult print(index_normal([1,6,2,4,5,2,8,6,3,2],2)) ##########输出########## [2,5,9] #生成器写法 defindex_generator(L,target): fori,numinenumerate(L): ifnum==target: yieldi print(list(index_generator([1,6,2,4,5,2,8,6,3,2],2))) #########输出########## [2,5,9]
再看一例子:
查找子序列:给定两个字符串a,b,查找字符串a是否字符串b的子序列,所谓子序列,即一个序列包含在另一个序列中并且顺序一
算法:分别用两个指针指向两个字符串的头,然后往后移动找出相同的值,如果其中一个指针走完了整个字符串也没有相同的值,则不是子序列
defis_subsequence(a,b): b=iter(b) returnall(iinbforiina) print(is_subsequence([1,3,5],[1,2,3,4,5])) print(is_subsequence([1,4,3],[1,2,3,4,5])) #########输出########## True False
下面代码为上面代码的演化版本
defis_subsequence(a,b): b=iter(b) print(b) gen=(iforiina) print(gen) foriingen: print(i) gen=((iinb)foriina) print(gen) foriingen: print(i) returnall(((iinb)foriina)) print(is_subsequence([1,3,5],[1,2,3,4,5])) print(is_subsequence([1,4,3],[1,2,3,4,5])) ##########输出########## ## . at0x000001E70651C570> #1 #3 #5 # . at0x000001E70651C5E8> #True #True #True #False # # . at0x000001E70651C5E8> #1 #4 #3 # . at0x000001E70651C570> #True #True #False #False
首先iter(b)把b转为迭代器。目的是内部实现next函数,(iforiina)会产生一个生成器,同样((iinb)foriina)也是。然后(iinb)等阶于:
whileTrue: val=next(b) ifval==i: yieldTrue
这里非常巧妙地利用生成器的特性,next()函数运行的时候,保存了当前的指针。比如下面这个示例
b=(iforiinrange(5)) print(2inb) print(4inb) print(3inb) ##########输出########## True True False
以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持毛票票。