你好
我是你们的雨嘉叔

09- Python Linux系统管理之文件读写

零、准备工作

1、安装Ipython(请见”00-Ipython的安装”)

2、实验用的文档(你自己用vi编辑器创建文件就好了)

一、Python内置的Open函数

在Python中,要对应文件进行操作,只要使用内置的Open函数打开文件即可。Open函数接受文件名和打开模式作为参数,返回一个文件对象。工程师通过文件对象来操作文件,完成以后,调用文件对象的close方法关闭文件即可。

例如,在当前目录下有一个名为data的文件,它的内容如下:

Beautiful is better than ugly.
Explicit is better than implicit.
Simple is better than complex.

Complex is better than complicated.

接下来,使用Open函数打开文件,调用文件对象的read方法读取文件的所有内容,完成以后,调用文件对象的close方法关闭文件,如下所示:

In [1]: f = open(‘data.txt’)
In [2]: print(f.read())
Beautiful is better than ugly.

Explicit is better than implicit.

Simple is better than complex.

Complex is better than complicated.

In [3]: f.close()

与其他编程语言类似,open函数默认以’r’模式打开,也可以指定文件的打开模式,如表所示。

表 文件的打开模式

模式

含义

‘r’

默认以读模式打开文件,如果文件不存在,抛出FileNotFoundError(文件没有找到)异常

‘w’

以写模式打开文件,如果文件非空,则文件已有的内容会被清空,如果文件不存在,则创建文件

‘x’

创建一个新的文件,如果文件已经存在,抛出FileExistsError(文件已存在)异常

‘a’

在文件末尾追加文件

下面代码分别演示,打开一个不存在的文件时’w’模式与’x’模式的区别:

In [4]: f = open(‘data1.txt’,’w’)
In [5]: f.write(‘Hello World’)
Out[5]: 11

In [6]: f.close()

In [7]: f = open(‘data1.txt’,’x’)

—————————————————————————

FileExistsError Traceback (most recent call last)

<ipython-input-7-fc8069bb2b02> in <module>()

—-> 1 f = open(‘data1.txt’,’x’)

FileExistsError: [Errno 17] File exists: ‘data1.txt’

—————————————————————————-

In [8]: f = open(‘data2.txt’,’x’)

In [9]: f.write(‘Hello World’)

Out[9]: 11

In [10]: f.close()

二、避免文件句柄泄露

在计算机程序中,每打开一个文件就需要占用一个文件句柄,而一个进程拥有文件的句柄是有限的。此外,文件句柄也会占用操作系统的资源,因此,在编写程序处理文件时需要注意,文件处理结束后及时关闭文件。文件句柄泄露或许是最常见的资源泄露问题,用finally关闭文件句柄。在Python中,也可以使用finally语句来保证,无论在什么情况下文件都会被关闭,如下所示:

try:
f = open(‘data.txt’)
print(f.read())

finally:

f.close()

Python中还有更加简洁优美的写法,即使用上下文管理器。虽然使用finally语句能够保证资源一定关闭,但是没有上下文管理器简洁好用。如果工程师可以在上下文管理器的情况下,使用了Finally语句,将会认为代码写的不够Pythonic。对于文件打开、处理、再关闭的逻辑,使用上下文管理器代码如下:

with open(‘data.txt’) as f:
print(f.read())

可以看到,使用上下文管理器以后代码行数变少了。在Python中,如果想想把代码写的简洁优美,就应该在保证可读性的前提下代码行数越少越好。

三、常见的文件操作函数

Python的文件对象有多重类型的函数,如刷新缓存的flush函数,获取文件位置的tell函数,改变文件读取偏移量的seek函数。但是,工作中使用最多的还是与读写相关的函数。下面来看几个Python中的读写函数。

Python提供了三个读相关的函数,分别是read、readline和readlines,他们的作用如下:

  • read:读取文件中的所有内容;
  • readline:一次读取一行;
  • readlines:将文件内容存到一个列表中,列表中的每一行对应于文件中的每一行。

我们可以使用上边的”data.txt”文件,分别测试这三个读函数的效果:

In [1]: f = open(‘data.txt’)
In [2]: f.read()
Out[2]: ‘Beautiful is better than ugly.\nExplicit is better than implicit.\nSimple is better than complex.\nComplex is better than complicated.\n’

In [3]: f.seek(0)

Out[3]: 0

In [4]: f.readline()

Out[4]: ‘Beautiful is better than ugly.\n’

In [5]: f.seek(0)

Out[5]: 0

In [6]: f.readlines()

Out[6]:

[‘Beautiful is better than ugly.\n’,

‘Explicit is better than implicit.\n’,

‘Simple is better than complex.\n’,

‘Complex is better than complicated.\n’]

这里可以看到,read和readlines函数都是一次就将所有内容读入内存中,对于文件较小的情况不会有什么问题。但是,如果处理的是大文件,这种使用方法会占用大量的内存,甚至有可能因为内存占用太多出现Out-Of-Memory错误。

Python提供了两个写函数,分别是write和writelines,他们的区别如下:

  • write:写字符串到文件中,并返回写入的字符串;
  • writelines:写一个字符串列表到文件中。

依然使用Ipython对文件对象的写入函数进行测试,并在写入完成以后使用Linux的cat命令查看文件内容:

In [1]: f = open(‘data.txt’,’w’)
In [2]: f.write(‘Beautiful is better than ugly.’)
Out[2]: 30

In [3]: f.writelines([‘Explicit is better than implicit.’,’Simple is better than complex.’])

cat data.txt

在Python中,除了使用文件对象的write函数和writelines函数向文件写入数据以外,也可以使用print函数将输出结果输出到文件中。print函数比write和writelines函数更加灵活,如下所示:

From __fureture__ import print_function
With open(‘data.txt’,’w’)as f:
print(1,2,’hello world’,sep”,”.file=f)
赞(1)
未经允许不得转载:嘉叔的博客 » 09- Python Linux系统管理之文件读写
分享到: 更多 (0)

评论 抢沙发

  • 昵称 (必填)
  • 邮箱 (必填)
  • 网址