如何将你的应用迁移到Python3的三个步骤
Python2.x很快就要失去官方支持了,尽管如此,从Python2迁移到Python3却并没有想象中那么难。我在上周用了一个晚上的时间将一个3D渲染器的前端代码及其对应的PySide迁移到Python3,回想起来,尽管在迁移过程中无可避免地会遇到一些牵一发而动全身的修改,但整个过程相比起痛苦的重构来说简直是出奇地简单。
每个人都别无选择地有各种必须迁移的原因:或许是觉得已经拖延太久了,或许是依赖了某个在Python2下不再维护的模块。但如果你仅仅是想通过做一些事情来对开源做贡献,那么把一个Python2应用迁移到Python3就是一个简单而又有意义的做法。
无论你从Python2迁移到Python3的原因是什么,这都是一项重要的任务。按照以下三个步骤,可以让你把任务完成得更加清晰。
1、使用2to3
从几年前开始,Python在你或许还不知道的情况下就已经自带了一个名叫2to3的脚本,它可以帮助你实现大部分代码从Python2到Python3的自动转换。
下面是一段使用Python2.6编写的代码:
#!/usr/bin/envpython #-*-coding:utf-8-*- mystring=u'abcdé' printord(mystring[-1])
对其执行2to3脚本:
$2to3example.py RefactoringTool:Refactoredexample.py ---example.py(original) +++example.py(refactored) @@-1,5+1,5@@ #!/usr/bin/envpython #-*-coding:utf-8-*- -mystring=u'abcdé' -printord(mystring[-1]) +mystring='abcdé' +print(ord(mystring[-1])) RefactoringTool:Filesthatneedtobemodified: RefactoringTool:example.py
在默认情况下,2to3只会对迁移到Python3时必须作出修改的代码进行标示,在输出结果中显示的Python3代码是直接可用的,但你可以在2to3加上-w或者--write参数,这样它就可以直接按照给出的方案修改你的Python2代码文件了。
$2to3-wexample.py [...] RefactoringTool:Filesthatweremodified: RefactoringTool:example.py
2to3脚本不仅仅对单个文件有效,你还可以把它用于一个目录下的所有Python文件,同时它也会递归地对所有子目录下的Python文件都生效。
2、使用Pylint或Pyflakes
有一些不良的代码在Python2下运行是没有异常的,在Python3下运行则会或多或少报出错误,这种情况并不鲜见。因为这些不良代码无法通过语法转换来修复,所以2to3对它们没有效果,但一旦使用Python3来运行就会产生报错。
要找出这种问题,你需要使用Pylint、Pyflakes(或flake8封装器)这类工具。其中我更喜欢Pyflakes,它会忽略代码风格上的差异,在这一点上它和Pylint不同。尽管代码优美是Python的一大特点,但在代码迁移的层面上,“让代码功能保持一致”无疑比“让代码风格保持一致”重要得多。
以下是Pyflakes的输出样例:
$pyflakesexample/maths example/maths/enum.py:19:undefinedname'cmp' example/maths/enum.py:105:localvariable'e'isassignedtobutneverused example/maths/enum.py:109:undefinedname'basestring' example/maths/enum.py:208:undefinedname'EnumValueCompareError' example/maths/enum.py:208:localvariable'e'isassignedtobutneverused
上面这些由Pyflakes输出的内容清晰地给出了代码中需要修改的问题。相比之下,Pylint会输出多达143行的内容,而且多数是诸如代码缩进这样无关紧要的问题。
值得注意的是第19行这个容易产生误导的错误。从输出来看你可能会以为cmp是一个在使用前未定义的变量,实际上cmp是Python2的一个内置函数,而它在Python3中被移除了。而且这段代码被放在了try语句块中,除非认真检查这段代码的输出值,否则这个问题很容易被忽略掉。
try: result=cmp(self.index,other.index) except: result=42 returnresult
在代码迁移过程中,你会发现很多原本在Python2中能正常运行的函数都发生了变化,甚至直接在Python3中被移除了。例如PySide的绑定方式发生了变化、importlib取代了imp等等。这样的问题只能见到一个解决一个,而涉及到的功能需要重构还是直接放弃,则需要你自己权衡。但目前来说,大多数问题都是已知的,并且有完善的文档记录。所以难的不是修复问题,而是找到问题,从这个角度来说,使用Pyflake是很有必要的。
3、修复被破坏的Python2代码
尽管2to3脚本能够帮助你把代码修改成兼容Python3的形式,但对于一个完整的代码库,它就显得有点无能为力了,因为一些老旧的代码在Python3中可能需要不同的结构来表示。在这样的情况下,只能人工进行修改。
例如以下代码在Python2.6中可以正常运行:
classCLOCK_SPEED: TICKS_PER_SECOND=16 TICK_RATES=[int(i*TICKS_PER_SECOND) foriin(0.5,1,2,3,4,6,8,11,20)] classFPS: STATS_UPDATE_FREQUENCY=CLOCK_SPEED.TICKS_PER_SECOND
类似2to3和Pyflakes这些自动化工具并不能发现其中的问题,但如果上述代码使用Python3来运行,解释器会认为CLOCK_SPEED.TICKS_PER_SECOND是未被明确定义的。因此就需要把代码改成面向对象的结构:
classCLOCK_SPEED: defTICKS_PER_SECOND(): TICKS_PER_SECOND=16 TICK_RATES=[int(i*TICKS_PER_SECOND) foriin(0.5,1,2,3,4,6,8,11,20)] returnTICKS_PER_SECOND classFPS: STATS_UPDATE_FREQUENCY=CLOCK_SPEED.TICKS_PER_SECOND()
你也许会认为如果把TICKS_PER_SECOND()改写为一个构造函数(用__init__函数设置默认值)能让代码看起来更加简洁,但这样就需要把这个方法的调用形式从CLOCK_SPEED.TICKS_PER_SECOND()改为CLOCK_SPEED()了,这样的改动或多或少会对整个库造成一些未知的影响。如果你对整个代码库的结构烂熟于心,那么你确实可以随心所欲地作出这样的修改。但我通常认为,只要我做出了修改,都可能会影响到其它代码中的至少三处地方,因此我更倾向于不使代码的结构发生改变。
坚持信念
如果你正在尝试将一个大项目从Python2迁移到Python3,也许你会觉得这是一个漫长的过程。你可能会费尽心思也找不到一条有用的报错信息,这种情况下甚至会有将代码推倒重建的冲动。但从另一个角度想,代码原本在Python2中就可以运行,要让它能在Python3中继续运行,你需要做的只是对它稍加转换而已。
但只要你完成了迁移,你就得到了这个模块或者整个应用程序的Python3版本,外加Python官方的长期支持。
以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持毛票票。
声明:本文内容来源于网络,版权归原作者所有,内容由互联网用户自发贡献自行上传,本网站不拥有所有权,未作人工编辑处理,也不承担相关法律责任。如果您发现有涉嫌版权的内容,欢迎发送邮件至:czq8825#qq.com(发邮件时,请将#更换为@)进行举报,并提供相关证据,一经查实,本站将立刻删除涉嫌侵权内容。