使用Python解决Windows文件名非用反斜杠问题(python 小技巧)
在编程过程中,我们往往会遇到一个小麻烦——微软Windows系统在文件夹名之间使用反斜杠字符,而几乎所有其它的计算机(操作系统)都使用正斜杠:
Windowsfilenames: C:\some_folder\some_file.txt Mostotheroperatingsystems: /some_folder/some_file.txt
这是由于上世纪80年代早期计算机历史上的一个小意外。「MS-DOS」的第一版使用了正斜杠字符来指定命令行选项。当微软在「MS-DOS2.0」中加入了对文件夹的支持时,正斜杠字符已经被使用了,所以他们采用了反斜杠作为替代。35年后,我们仍然被受困于这种不一致性。
如果你想让你的Python代码同时在Windows和Mac/Linux上工作,你就需要处理这种与平台相关的问题。幸运的是,Python3有一个名为「pathlib」的新模块,使得用户处理文件几乎没有任何困难。
「pathlib」模块链接:https://docs.python.org/3/library/pathlib.html
让我们快速浏览一下处理文件名路径的不同方法,看看「pathlib」如何能让你的生活变得更美好!
错误的解决方案:手动构建文件路径
假设你有一个数据文件夹,该文件夹包含你想要在你的Python程序中打开的文件:
在Python中对其进行编码是「错误」的方式:
data_folder="source_data/text_files/" file_to_open=data_folder+"raw_data.txt" f=open(file_to_open) print(f.read())
请注意,由于我使用的是Mac系统,所以我使用了「Unix」风格的正斜杠对路径进行了硬编码。这也会让Windows的用户感到愤怒。
从技术上讲,这段代码在Windows上仍然有效,因为Python有一个「黑客」(hack)技术:当你在Windows上调用「open()」函数时,它会识别这两种斜线。但即便如此,你也不应该依赖它。如果你在错误的操作系统上使用了错误类型的斜杠(尤其是在它们与外部程序或代码库交互时),并不是所有的Python库都会正常工作。
Python对混合斜杠类型的支持是一种只针对Windows的「黑客」技术,它反过来并不起作用。在Mac系统环境下,在代码中使用反斜杠会导致彻底失败:
data_folder="source_data\\text_files\\" file_to_open=data_folder+"raw_data.txt" f=open(file_to_open) print(f.read()) #OnaMac,thiscodewillthrowanexception: #FileNotFoundError:[Errno2]Nosuchfileordirectory:'source_data\\text_files\\raw_data.txt'
由于所有这些原因以及其他原因,使用硬编码的路径字符串编写代码,是一种会让其他程序员十分「嫌弃」的做法。一般来说,你应该尽量避免这么做。
以前的解决方案:Python的「os.path」模块
Python的「os.path」模块有很多工具来处理这类针对特定操作系统的文件系统问题。
你可以使用「os.path.join()」为当前的操作系统构建一个使用正确类型斜杠的路径字符串:
importos.path data_folder=os.path.join("source_data","text_files") file_to_open=os.path.join(data_folder,"raw_data.txt") f=open(file_to_open) print(f.read())
这段代码可以同时在「Windows」或「Mac」系统上完美运行。问题是它使用起来很麻烦。写出「os.path.join()」并将路径的每个部分作为独立的字符串传给该函数非常冗长,而且很不直观。
由于「os.path」模块中的大多数函数使用起来很烦人,开发者们通常会「忘记」使用它们,即使他们知道这样做更好。这导致出现了很多跨平台的Bug,也引起了用户的愤怒。
更好的解决方案:Python3的「pathlib」!
为了处理文件和路径,Python3.4引入了一个名为「pathlib」的新标准库,而且非常好用!
要使用该库,你只需使用正斜杠将一个路径或文件名传给一个新的「Path()」对象,然后它将处理余下的操作:
frompathlibimportPath data_folder=Path("source_data/text_files/") file_to_open=data_folder/"raw_data.txt" f=open(file_to_open) print(f.read())
在这里,有两点需要注意:
- 你应该在使用「pathlib」函数的情况下使用正斜杠。「Path()」函数将会把正斜杠转化为适应当前操作系统环境的正确斜杠。赞!
- 如果你想要在路径上进行添加,你可以直接在你的代码中使用「/」操作符。你再也不用一遍又一遍地输入「os.path.join(a,b)」了。
如果「pathlib」所做的就这么多,它也已经是对于Python的一个很好的补充了。但是,它还能做更多!
例如,我们可以在无需打开和关闭文件的情况下,读取文本文件的内容:
frompathlibimportPath data_folder=Path("source_data/text_files/") file_to_open=data_folder/"raw_data.txt" print(file_to_open.read_text())
专业提示:之前的示例是有Bug的,因为打开的文件从来没有被关闭过。而这里的这种语法则彻底避免了这个Bug。
事实上,「pathlib」使大多数标准的文件操作变得快速而简单:
frompathlibimportPath filename=Path("source_data/text_files/raw_data.txt") print(filename.name) #prints"raw_data.txt" print(filename.suffix) #prints"txt" print(filename.stem) #prints"raw_data" ifnotfilename.exists(): print("Oops,filedoesn'texist!") else: print("Yay,thefileexists!")
你甚至可以使用「pathlib」显式地将一个「Unix」路径转化为一个「Windows」格式的路径:
frompathlibimportPath,PureWindowsPath filename=Path("source_data/text_files/raw_data.txt") #ConvertpathtoWindowsformat path_on_windows=PureWindowsPath(filename) print(path_on_windows) #prints"source_data\text_files\raw_data.txt"
如果你真的想安全地在你的代码中使用反斜杠,你可以按照「Windows」格式声明你的路径,而「pathlib」可以对其进行转化,使其能在当前的操作系统中工作:
frompathlibimportPath,PureWindowsPath #I'veexplicitlydeclaredmypathasbeinginWindowsformat,soIcanuseforwardslashesinit. filename=PureWindowsPath("source_data\\text_files\\raw_data.txt") #Convertpathtotherightformatforthecurrentoperatingsystem correct_path=Path(filename) print(correct_path) #prints"source_data/text_files/raw_data.txt"onMacandLinux #prints"source_data\text_files\raw_data.txt"onWindows
如果你想把代码写得更「高级」一些,你甚至可以使用「pathlib」来做诸如解析相对路径、解析网络共享路径并生成
「file://urls」之类的事。在下面的例子中,我们将仅仅使用两行代码,在你的web浏览器中打开一个本地文件夹:
frompathlibimportPath importwebbrowser filename=Path("source_data/text_files/raw_data.txt") webbrowser.open(filename.absolute().as_uri())
这只是「pathlib」的好处之一。它很好地替代了过去分散在不同Python模块中与文件相关的许多不同功能。
总结
以上所述是小编给大家介绍的使用Python解决Windows文件名非用反斜杠问题,希望对大家有所帮助,如果大家有任何疑问请给我留言,小编会及时回复大家的。在此也非常感谢大家对毛票票网站的支持!
如果你觉得本文对你有帮助,欢迎转载,烦请注明出处,谢谢!
声明:本文内容来源于网络,版权归原作者所有,内容由互联网用户自发贡献自行上传,本网站不拥有所有权,未作人工编辑处理,也不承担相关法律责任。如果您发现有涉嫌版权的内容,欢迎发送邮件至:czq8825#qq.com(发邮件时,请将#更换为@)进行举报,并提供相关证据,一经查实,本站将立刻删除涉嫌侵权内容。