Python 2.7.x 和 3.x 版本的重要区别小结
许多Python初学者都会问:我应该学习哪个版本的Python。对于这个问题,我的回答通常是“先选择一个最适合你的Python教程,教程中使用哪个版本的Python,你就用那个版本。等学得差不多了,再来研究不同版本之间的差别”。
但如果想要用Python开发一个新项目,那么该如何选择Python版本呢?我可以负责任的说,大部分Python库都同时支持Python2.7.x和3.x版本的,所以不论选择哪个版本都是可以的。但为了在使用Python时避开某些版本中一些常见的陷阱,或需要移植某个Python项目时,依然有必要了解一下Python两个常见版本之间的主要区别。
目录
- 使用__future__模块
- print函数
- 整数除法
- Unicode
- xrange
- 触发异常
- 处理异常
- next()函数和.next()方法
- For循环变量与全局命名空间泄漏
- 比较无序类型
- 使用input()解析输入内容
- 返回可迭代对象,而不是列表
- 更多关于Python2和Python3的文章
__future__模块
[回到目录]
Python3.x引入了一些与Python2不兼容的关键字和特性,在Python2中,可以通过内置的__future__模块导入这些新内容。如果你希望在Python2环境下写的代码也可以在Python3.x中运行,那么建议使用__future__模块。例如,如果希望在Python2中拥有Python3.x的整数除法行为,可以通过下面的语句导入相应的模块。
from__future__importdivision
下表列出了__future__中其他可导入的特性:
StaticallyNestedScopes
SimpleGenerators
ChangingtheDivisionOperator
Imports:Multi-LineandAbsolute/Relative
The“with”Statement
Makeprintafunction
BytesliteralsinPython3000
(来源:https://docs.python.org/2/library/future.html)
示例:
fromplatformimportpython_version
[回到目录]
虽然print语法是Python3中一个很小的改动,且应该已经广为人知,但依然值得提一下:Python2中的print语句被Python3中的print()函数取代,这意味着在Python3中必须用括号将需要输出的对象括起来。
在Python2中使用额外的括号也是可以的。但反过来在Python3中想以Python2的形式不带括号调用print函数时,会触发SyntaxError。
Python2
print'Python',python_version() print'Hello,World!' print('Hello,World!') print"text",;print'printmoretextonthesameline'
Python2.7.6 Hello,World! Hello,World! textprintmoretextonthesameline
Python3
print('Python',python_version()) print('Hello,World!') print("sometext,",end="") print('printmoretextonthesameline')
Python3.4.1 Hello,World! sometext,printmoretextonthesameline
print'Hello,World!'
File"<ipython-input-3-139a7c5835bd>",line1 print'Hello,World!' ^ SyntaxError:invalidsyntax
注意:
在Python中,带不带括号输出”HelloWorld”都很正常。但如果在圆括号中同时输出多个对象时,就会创建一个元组,这是因为在Python2中,print是一个语句,而不是函数调用。
print'Python',python_version() print('a','b') print'a','b'
Python2.7.7 ('a','b') ab
[回到目录]
由于人们常常会忽视Python3在整数除法上的改动(写错了也不会触发SyntaxError),所以在移植代码或在Python2中执行Python3的代码时,需要特别注意这个改动。
所以,我还是会在Python3的脚本中尝试用float(3)/2或3/2.0代替3/2,以此来避免代码在Python2环境下可能导致的错误(或与之相反,在Python2脚本中用from__future__importdivision来使用Python3的除法)。
Python2
print'Python',python_version() print'3/2=',3/2 print'3//2=',3//2 print'3/2.0=',3/2.0 print'3//2.0=',3//2.0
Python2.7.6 3/2=1 3//2=1 3/2.0=1.5 3//2.0=1.0
Python3
print('Python',python_version()) print('3/2=',3/2) print('3//2=',3//2) print('3/2.0=',3/2.0) print('3//2.0=',3//2.0)
Python3.4.1 3/2=1.5 3//2=1 3/2.0=1.5 3//2.0=1.0
[回到目录]
Python2有基于ASCII的str()类型,其可通过单独的unicode()函数转成unicode类型,但没有byte类型。
而在Python3中,终于有了Unicode(utf-8)字符串,以及两个字节类:bytes和bytearrays。
Python2
print'Python',python_version()
Python2.7.6
printtype(unicode('thisislikeapython3strtype'))
<type'unicode'>
printtype(b'bytetypedoesnotexist')
<type'str'>
print'theyarereally'+b'thesame'
theyarereallythesame
printtype(bytearray(b'bytearrayoddlydoesexistthough'))
<type'bytearray'>
Python3
print('Python',python_version()) print('stringsarenowutf-8u03BCnicou0394é!')
Python3.4.1 stringsarenowutf-8μnicoΔé!
print('Python',python_version(),end="") print('has',type(b'bytesforstoringdata'))
Python3.4.1has<class'bytes'>
print('andPython',python_version(),end="") print('alsohas',type(bytearray(b'bytearrays')))
andPython3.4.1alsohas<class'bytearray'>
'notethatwecannotaddastring'+b'bytesfordata'
--------------------------------------------------------------------------- TypeErrorTraceback(mostrecentcalllast) <ipython-input-13-d3e8942ccf81>in<module>() ---->1'notethatwecannotaddastring'+b'bytesfordata' TypeError:Can'tconvert'bytes'objecttostrimplicitly
[回到目录]
在Python2.x中,经常会用xrange()创建一个可迭代对象,通常出现在“for循环”或“列表/集合/字典推导式”中。
这种行为与生成器非常相似(如”惰性求值“),但这里的xrange-iterable无尽的,意味着可能在这个xrange上无限迭代。
由于xrange的“惰性求知“特性,如果只需迭代一次(如for循环中),range()通常比xrange()快一些。不过不建议在多次迭代中使用range(),因为range()每次都会在内存中重新生成一个列表。
在Python3中,range()的实现方式与xrange()函数相同,所以就不存在专用的xrange()(在Python3中使用xrange()会触发NameError)。
importtimeit n=10000 deftest_range(n): returnforiinrange(n): pass deftest_xrange(n): foriinxrange(n): pass
Python2
print'Python',python_version() print'ntimingrange()' %timeittest_range(n) print'nntimingxrange()' %timeittest_xrange(n)
Python2.7.6 timingrange() 1000loops,bestof3:433µsperloop timingxrange() 1000loops,bestof3:350µsperloop
Python3
print('Python',python_version()) print('ntimingrange()') %timeittest_range(n)
Python3.4.1 timingrange() 1000loops,bestof3:520µsperloop
print(xrange(10))
--------------------------------------------------------------------------- NameErrorTraceback(mostrecentcalllast) in() ---->1print(xrange(10)) NameError:name'xrange'isnotdefined
Python3中的range对象中的__contains__方法
另一个值得一提的是,在Python3.x中,range有了一个新的__contains__方法。__contains__方法可以有效的加快Python3.x中整数和布尔型的“查找”速度。
x=10000000 defval_in_range(x,val): returnvalinrange(x) defval_in_xrange(x,val): returnvalinxrange(x) print('Python',python_version()) assert(val_in_range(x,x/2)==True) assert(val_in_range(x,x//2)==True) %timeitval_in_range(x,x/2) %timeitval_in_range(x,x//2)
Python3.4.1 1loops,bestof3:742msperloop 1000000loops,bestof3:1.19µsperloop
根据上面的timeit的结果,查找整数比查找浮点数要快大约6万倍。但由于Python2.x中的range或xrange没有__contains__方法,所以在Python2中的整数和浮点数的查找速度差别不大。
print'Python',python_version() assert(val_in_xrange(x,x/2.0)==True) assert(val_in_xrange(x,x/2)==True) assert(val_in_range(x,x/2)==True) assert(val_in_range(x,x//2)==True) %timeitval_in_xrange(x,x/2.0) %timeitval_in_xrange(x,x/2) %timeitval_in_range(x,x/2.0) %timeitval_in_range(x,x/2)
Python2.7.7 1loops,bestof3:285msperloop 1loops,bestof3:179msperloop 1loops,bestof3:658msperloop 1loops,bestof3:556msperloop
下面的代码证明了Python2.x中没有__contain__方法:
print('Python',python_version()) range.__contains__
Python3.4.1 <slotwrapper'__contains__'of'range'objects
print('Python',python_version()) range.__contains__
Python2.7.7 --------------------------------------------------------------------------- AttributeErrorTraceback(mostrecentcalllast) <ipython-input-7-05327350dafb>in<module>() 1print'Python',python_version() ---->2range.__contains__ AttributeError:'builtin_function_or_method'objecthasnoattribute'__contains__'
print('Python',python_version()) xrange.__contains__
Python2.7.7 --------------------------------------------------------------------------- AttributeErrorTraceback(mostrecentcalllast) in() 1print'Python',python_version() ---->2xrange.__contains__ AttributeError:typeobject'xrange'hasnoattribute'__contains__'
关于Python2中xrange()与Python3中range()之间的速度差异的一点说明:
有读者指出了Python3中的range()和Python2中xrange()执行速度有差异。由于这两者的实现方式相同,因此理论上执行速度应该也是相同的。这里的速度差别仅仅是因为Python3的总体速度就比Python2慢。
deftest_while(): i=0 whilei<20000: i+=1 return
print('Python',python_version()) %timeittest_while()
Python3.4.1 %timeittest_while() 100loops,bestof3:2.68msperloop
print'Python',python_version() %timeittest_while()
Python2.7.6 1000loops,bestof3:1.72msperloop
[回到目录]
Python2支持新旧两种异常触发语法,而Python3只接受带括号的的语法(不然会触发SyntaxError):
Python2
print'Python',python_version()
Python2.7.6
raiseIOError,"fileerror"
--------------------------------------------------------------------------- IOErrorTraceback(mostrecentcalllast) <ipython-input-8-25f049caebb0>in<module>() ---->1raiseIOError,"fileerror" IOError:fileerror
raiseIOError("fileerror")
--------------------------------------------------------------------------- IOErrorTraceback(mostrecentcalllast) <ipython-input-9-6f1c43f525b2>in<module>() ---->1raiseIOError("fileerror") IOError:fileerror
print('Python',python_version())
Python3.4.1
raiseIOError,"fileerror"
File"<ipython-input-10-25f049caebb0>",line1 raiseIOError,"fileerror" ^ SyntaxError:invalidsyntax TheproperwaytoraiseanexceptioninPython3:
print('Python',python_version()) raiseIOError("fileerror")
Python3.4.1 --------------------------------------------------------------------------- OSErrorTraceback(mostrecentcalllast) <ipython-input-11-c350544d15da>in<module>() 1print('Python',python_version()) ---->2raiseIOError("fileerror") OSError:fileerror
[回到目录]
Python3中的异常处理也发生了一点变化。在Python3中必须使用“as”关键字。
Python2
print'Python',python_version() try: let_us_cause_a_NameError exceptNameError,err: printerr,'-->ourerrormessage'
Python2.7.6 name'let_us_cause_a_NameError'isnotdefined-->ourerrormessage
Python3
print('Python',python_version()) try: let_us_cause_a_NameError exceptNameErroraserr: print(err,'-->ourerrormessage')
Python3.4.1 name'let_us_cause_a_NameError'isnotdefined-->ourerrormessage
[回到目录]
由于会经常用到next()(.next())函数(方法),所以还要提到另一个语法改动(实现方面也做了改动):在Python2.7.5中,函数形式和方法形式都可以使用,而在Python3中,只能使用next()函数(试图调用.next()方法会触发AttributeError)。
Python2
print'Python',python_version() my_generator=(letterforletterin'abcdefg') next(my_generator) my_generator.next()
Python2.7.6 'b'
Python3
print('Python',python_version()) my_generator=(letterforletterin'abcdefg') next(my_generator)
Python3.4.1 'a'
my_generator.next()
--------------------------------------------------------------------------- AttributeErrorTraceback(mostrecentcalllast) <ipython-input-14-125f388bb61b>in<module>() ---->1my_generator.next() AttributeError:'generator'objecthasnoattribute'next'
[回到目录]
好消息是:在Python3.x中,for循环中的变量不再会泄漏到全局命名空间中了!
这是Python3.x中做的一个改动,在“What'sNewInPython3.0”中有如下描述:
“列表推导不再支持[...forvarinitem1,item2,...]这样的语法,使用[...forvarin(item1,item2,...)]代替。还要注意列表推导有不同的语义:现在列表推导更接近list()构造器中的生成器表达式这样的语法糖,特别要注意的是,循环控制变量不会再泄漏到循环周围的空间中了。”
Python2
print'Python',python_version() i=1 print'before:i=',i print'comprehension:',[iforiinrange(5)] print'after:i=',i
Python2.7.6 before:i=1 comprehension:[0,1,2,3,4] after:i=4
Python3
print('Python',python_version()) i=1 print('before:i=',i) print('comprehension:',[iforiinrange(5)]) print('after:i=',i)
Python3.4.1 before:i=1 comprehension:[0,1,2,3,4] after:i=1
[回到目录]
Python3中另一个优秀的改动是,如果我们试图比较无序类型,会触发一个TypeError。
Python2
print'Python',python_version() print"[1,2]>'foo'=",[1,2]>'foo' print"(1,2)>'foo'=",(1,2)>'foo' print"[1,2]>(1,2)=",[1,2]>(1,2)
Python2.7.6 [1,2]>'foo'=False (1,2)>'foo'=True [1,2]>(1,2)=False
Python3
print('Python',python_version()) print("[1,2]>'foo'=",[1,2]>'foo') print("(1,2)>'foo'=",(1,2)>'foo') print("[1,2]>(1,2)=",[1,2]>(1,2))
Python3.4.1 --------------------------------------------------------------------------- TypeErrorTraceback(mostrecentcalllast) <ipython-input-16-a9031729f4a0>in<module>() 1print('Python',python_version()) ---->2print("[1,2]>'foo'=",[1,2]>'foo') 3print("(1,2)>'foo'=",(1,2)>'foo') 4print("[1,2]>(1,2)=",[1,2]>(1,2)) TypeError:unorderabletypes:list()>str()
[回到目录]
幸运的是,Python3改进了input()函数,这样该函数就会总是将用户的输入存储为str对象。在Python2中,为了避免读取非字符串类型会发生的一些危险行为,不得不使用raw_input()代替input()。
Python2
Python2.7.6 [GCC4.0.1(AppleInc.build5493)]ondarwin Type"help","copyright","credits"or"license"formoreinformation. >>>my_input=input('enteranumber:') enteranumber:123 >>>type(my_input) <type'int'> >>>my_input=raw_input('enteranumber:') enteranumber:123 >>>type(my_input) <type'str'>
Python3
Python3.4.1 [GCC4.2.1(AppleInc.build5577)]ondarwin Type"help","copyright","credits"or"license"formoreinformation. >>>my_input=input('enteranumber:') enteranumber:123 >>>type(my_input) <class'str'>
[回到目录]
在xrange一节中可以看到,某些函数和方法在Python中返回的是可迭代对象,而不像在Python2中返回列表。
由于通常对这些对象只遍历一次,所以这种方式会节省很多内存。然而,如果通过生成器来多次迭代这些对象,效率就不高了。
此时我们的确需要列表对象,可以通过list()函数简单的将可迭代对象转成列表。
Python2
print'Python',python_version() printrange(3) printtype(range(3))
Python2.7.6 [0,1,2] <type'list'>
Python3
print('Python',python_version()) print(range(3)) print(type(range(3))) print(list(range(3)))
Python3.4.1 range(0,3) <class'range'> [0,1,2]
下面列出了Python3中其他不再返回列表的常用函数和方法:
- zip()
- map()
- filter()
- 字典的.key()方法
- 字典的.value()方法
- 字典的.item()方法
[回到目录]
下面列出了其他一些可以进一步了解Python2和Python3的优秀文章,
//迁移到Python3
- ShouldIusePython2orPython3formydevelopmentactivity?
- What'sNewInPython3.0
- PortingtoPython3
- PortingPython2CodetoPython3
- HowkeepPython3movingforward
//对Python3的褒与贬
- 10awesomefeaturesofPythonthatyoucan'tusebecauseyourefusetoupgradetoPython3
- 关于你不想知道的所有Python3unicode特性
- Python3正在毁灭Python
- Python3能振兴Python
- Python3isfine