Python fileinput模块如何逐行读取多个文件
Python提供了fileinput模块,通过该模块中的input()函数,我们能同时打开指定的多个文件,还可以逐个读取这些文件中的内容。
fileinput模块中input()该函数的语法格式如下:
fileinput.input(files="filename1,filename2,...",inplace=False,backup='',bufsize=0,mode='r',openhook=None)
此函数会返回一个FileInput对象,它可以理解为是将多个指定文件合并之后的文件对象。其中,各个参数的含义如下:
- files:多个文件的路径列表;
- inplace:用于指定是否将标准输出的结果写回到文件,此参数默认值为False;
- backup:用于指定备份文件的扩展名;
- bufsize:指定缓冲区的大小,默认为0;
- mode:打开文件的格式,默认为r(只读格式);
- openhook:控制文件的打开方式,例如编码格式等。
注意,和open()函数不同,input()函数不能指定打开文件的编码格式,这意味着使用该函数读取的所有文件,除非以二进制方式进行读取,否则该文件编码格式都必须和当前操作系统默认的编码格式相同,不然Python解释器可能会提示UnicodeDecodeError错误。
和open()函数返回单个的文件对象不同,fileinput对象无需调用类似read()、readline()、readlines()这样的函数,直接通过for循环即可按次序读取多个文件中的数据。
值得一提的是,fileinput模块还提供了很多使用的函数(如表1所示),通过调用这些函数,可以帮我们更快地实现想要的功能。
表fileinput模块常用函数
函数名 | 功能描述 |
---|---|
fileinput.filename() | 返回当前正在读取的文件名称。 |
fileinput.fileno() | 返回当前正在读取文件的文件描述符。 |
fileinput.lineno() | 返回当前读取了多少行。 |
fileinput.filelineno() | 返回当前正在读取的内容位于当前文件中的行号。 |
fileinput.isfirstline() | 判断当前读取的内容在当前文件中是否位于第1行。 |
fileinput.nextfile() | 关闭当前正在读取的文件,并开始读取下一个文件。 |
fileinput.close() | 关闭FileInput对象。 |
文件描述符是一个文件的代号,其值为一个整数。后续章节将会介绍关于文件描述符的操作。
讲了这么多,接下来举个例子。假设使用input()读取2个文件,分别为my_file.txt和file.txt,它们位于同一目录,且各自包含的内容如下所示:
#file.txt
Python教程
http://c.biancheng.net/python/#my_file.txt
Linux教程
http://c.biancheng.net/linux_tutorial/
下面程序演示了如何使用input()函数依次读取这2个文件:
importfileinput
#使用for循环遍历fileinput对象
forlineinfileinput.input(files=('my_file.txt','file.txt')):
#输出读取到的内容
print(line)
#关闭文件流
fileinput.close()
在使用fileinput模块中的input()函数之前,一定要先引入fileinput模块。
程序执行结果为:
Linux教程
http://c.biancheng.net/linux_tutorial/
Python教程http://c.biancheng.net/python/
显然,读取文件内容的次序,取决于input()函数中文件名的先后次序。
以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持毛票票。