详解Python3中yield生成器的用法
任何使用yield的函数都称之为生成器,如:
defcount(n): whilen>0: yieldn#生成值:n n-=1
另外一种说法:生成器就是一个返回迭代器的函数,与普通函数的区别是生成器包含yield语句,更简单点理解生成器就是一个迭代器。
使用yield,可以让函数生成一个序列,该函数返回的对象类型是"generator",通过该对象连续调用next()方法返回序列值。
c=count(5) c.__next__()#python3.4.3要使用c.__next__()不能使用c.next() >>>5 c.__next__() >>>4
生成器函数只有在调用__next()__方法的时候才开始执行函数里面的语句,比如:
defcount(n): print("cunting") whilen>0: yieldn#生成值:n n-=1
在调用count函数时:c=count(5),并不会打印"counting"只有等到调用c.__next__()时才真正执行里面的语句。每次调用__next__()方法时,count函数会运行到语句yieldn处为止,__next__()的返回值就是生成值n,再次调用__next__()方法时,函数继续执行yield之后的语句(熟悉Java的朋友肯定知道Thread.yield()方法,作用是暂停当前线程的运行,让其他线程执行),如:
defcount(n): print("cunting") whilen>0: print('beforeyield') yieldn#生成值:n n-=1 print('afteryield')
上述代码在第一次调用__next__方法时,并不会打印"afteryield"。如果一直调用__next__方法,当执行到没有可迭代的值后,程序就会报错:
Traceback(mostrecentcalllast):File"",line1,inStopIteration
所以一般不会手动的调用__next__方法,而使用for循环:
foriincount(5): print(i),
实例:用yield生成器模拟Linux中命令:tail-ffile|greppython用于查找监控日志文件中出现有python字样的行。
importtime deftail(f): f.seek(0,2)#移动到文件EOF whileTrue: line=f.readline()#读取文件中新的文本行 ifnotline: time.sleep(0.1) continue yieldline defgrep(lines,searchtext): forlineinlines: ifsearchtextinline: yieldline flog=tail(open('warn.log')) pylines=grep(flog,'python') forlineinpylines: print(line,) #当此程序运行时,若warn.log文件中末尾有新增一行,且该一行包含python,该行就会被打印出来 #若打开warn.log时,末尾已经有了一行包含python,该行不会被打印,因为上面是f.seek(0,2)移动到了文件EOF处 #故,上面程序实现了tail-fwarn.log|grep'python'的功能,动态实时检测warn.log中是否新增现了 #新的行,且该行包含python
用yield实现斐波那契数列:
deffibonacci(): a=b=1 yielda yieldb whileTrue: a,b=b,a+b yieldb
调用:
fornuminfibonacci(): ifnum>100: break print(num),
yield中return的作用:
作为生成器,因为每次迭代就会返回一个值,所以不能显示的在生成器函数中return某个值,包括None值也不行,否则会抛出“SyntaxError”的异常,但是在函数中可以出现单独的return,表示结束该语句。
通过固定长度的缓冲区不断读文件,防止一次性读取出现内存溢出的例子:
defread_file(path): size=1024 withopen(path,'r')asf: whileTrue: block=f.read(SIZE) ifblock: yieldblock else: return
如果是在函数中return具体某个值,就直接抛异常了
>>>deftest_return(): ...yield4 ...return0 ... File"<stdin>",line3 SyntaxError:'return'withargumentinsidegenerator
例子
下面来看几段代码示例:
例1:
>>>defmygenerator(): ...print'start...' ...yield5 ... >>>mygenerator()//在此处调用,并没有打印出start...说明存在yield的函数没有被运行,即暂停 <generatorobjectmygeneratorat0xb762502c> >>>mygenerator().next()//调用next()即可让函数运行. start... 5 >>>
如一个函数中出现多个yield则next()会停止在下一个yield前,见例2:
例2:
>>>deffun2(): ...print'first' ...yield5 ...print'second' ...yield23 ...print'end...' ... >>>g1=fun2() >>>g1.next()//第一次运行,暂停在yield5 first 5 >>>g1.next()//第二次运行,暂停在yield23 second 23 >>>g1.next()//第三次运行,由于之后没有yield,再次next()就会抛出错误 end... Traceback(mostrecentcalllast): File"<stdin>",line1,in<module> StopIteration >>>
为什么yield5会输出5,yield23会输出23?
我们猜测可能是因为yield是表达式,存在返回值.
那么这是否可以认为yield5的返回值一定是5吗?实际上并不是这样,这个与send函数存在一定的关系,这个函数实质上与next()是相似的,区别是send是传递yield表达式的值进去,而next不能传递特定的值,只能传递None进去,因此可以认为g.next()和g.send(None)是相同的。见例3:
例3:
>>>deffun(): ...print'start...' ...m=yield5 ...printm ...print'middle...' ...d=yield12 ...printd ...print'end...' ... >>>m=fun()//创建一个对象 >>>m.next()//会使函数执行到下一个yield前 start... 5 >>>m.send('message')//利用send()传递值 message//send()传递进来的 middle... 12 >>>m.next() None//可见next()返回值为空 end... Traceback(mostrecentcalllast): File"<stdin>",line1,in<module> StopIteration