9.文件处理

在本文中将提供Python中的文件操作

一、实验目的

  • 文件打开与关闭
  • 文件读取与写入

二、知识要点

1.打印到屏幕
1
print("Python 是一个非常棒的语言,不是吗?")

输出为:Python 是一个非常棒的语言,不是吗?

2.读取键盘输入
  • raw_input:raw_input([prompt]) 函数从标准输入读取一个行,并返回一个字符串(去掉结尾的换行符),例如:
1
2
str = raw_input("请输入:")
print("你输入的内容是: ", str)

输出为:

1
2
请输入:Hello Python!
你输入的内容是: Hello Python!

  • input():input([prompt]) 函数和 raw_input([prompt]) 函数基本类似,但是 input 可以接收一个Python表达式作为输入,并将运算结果返回。例如:
1
2
str = input("请输入:")
print("你输入的内容是: ", str)

这会产生如下的对应着输入的结果:

1
2
请输入:[x*5 for x in range(2,10,2)]
你输入的内容是: [10, 20, 30, 40]

3.文件操作

3.1 open()打开文件
用Python内置的open()函数打开一个文件,创建一个file对象,相关的方法才可以调用它进行读写。语法如下:

1
file object = open(file_name [, access_mode][, buffering])

各个参数详解:

  • file_name:file_name变量是一个包含了你要访问的文件名称的字符串值。
  • access_mode:access_mode决定了打开文件的模式:只读,写入,追加等。所有可取值见如下的完全列表。这个参数是非强制的,默认文件访问模式为只读(r)。
  • buffering:如果buffering的值被设为0,就不会有寄存。如果buffering的值取1,访问文件时会寄存行。如果将buffering的值设为大于1的整数,表明了这就是的寄存区的缓冲大小。如果取负值,寄存区的缓冲大小则为系统默认。

不同模式下打开文件的列表如下:

点击显/隐表格
模式 描述
t 文本模式 (默认)。
x 写模式,新建一个文件,如果该文件已存在则会报错。
b 二进制模式。
+ 打开一个文件进行更新(可读可写)。
U 通用换行模式(不推荐)。
r 以只读方式打开文件。文件的指针将会放在文件的开头。这是默认模式。
rb 以二进制格式打开一个文件用于只读。文件指针将会放在文件的开头。这是默认模式。一般用于非文本文件如图片等。
r+ 打开一个文件用于读写。文件指针将会放在文件的开头。
rb+ 以二进制格式打开一个文件用于读写。文件指针将会放在文件的开头。一般用于非文本文件如图片等。
w 打开一个文件只用于写入。如果该文件已存在则打开文件,并从开头开始编辑,即原有内容会被删除。如果该文件不存在,创建新文件。
wb 以二进制格式打开一个文件只用于写入。如果该文件已存在则打开文件,并从开头开始编辑,即原有内容会被删除。如果该文件不存在,创建新文件。一般用于非文本文件如图片等。
w+ 打开一个文件用于读写。如果该文件已存在则打开文件,并从开头开始编辑,即原有内容会被删除。如果该文件不存在,创建新文件。
wb+ 以二进制格式打开一个文件用于读写。如果该文件已存在则打开文件,并从开头开始编辑,即原有内容会被删除。如果该文件不存在,创建新文件。一般用于非文本文件如图片等。
a 打开一个文件用于追加。如果该文件已存在,文件指针将会放在文件的结尾。也就是说,新的内容将会被写入到已有内容之后。如果该文件不存在,创建新文件进行写入。
ab 以二进制格式打开一个文件用于追加。如果该文件已存在,文件指针将会放在文件的结尾。也就是说,新的内容将会被写入到已有内容之后。如果该文件不存在,创建新文件进行写入。
a+ 打开一个文件用于读写。如果该文件已存在,文件指针将会放在文件的结尾。文件打开时会是追加模式。如果该文件不存在,创建新文件用于读写。
ab+ 以二进制格式打开一个文件用于追加。如果该文件已存在,文件指针将会放在文件的结尾。如果该文件不存在,创建新文件用于读写。

对于不同模式的可用操作如下表所示:

模式 r r+ w w+ a a+
+ + + +
+ + + + +
创建 + + + +
覆盖 + +
指针在开始 + + + +
指针在结尾 + +

3.2 close()关闭文件
File对象的 close()方法刷新缓冲区里任何还没写入的信息,并关闭该文件,这之后便不能再进行写入。当一个文件对象的引用被重新指定给另一个文件时,Python 会关闭之前的文件。用 close()方法关闭文件是一个很好的习惯。基本语法:

1
fileObject.close()

例如:
1
2
3
4
5
# 打开一个文件
fo = open("foo.txt", "w")
print("文件名: ", fo.name)
# 关闭打开的文件
fo.close()

输出:文件名: foo.txt


拓展:File对象的属性
一个文件被打开后,你有一个file对象,你可以得到有关该文件的各种信息。以下是和file对象相关的所有属性的列表:

属性 描述
file.closed 返回true如果文件已被关闭,否则返回false。
file.mode 返回被打开文件的访问模式。
file.name 返回文件的名称。

例如,首先在根目录下创建文件sample.txt,然后执行程序:

1
2
3
4
fo = open("sample.txt", "w")
print("文件名: ", fo.name)
print("是否已关闭 : ", fo.closed)
print("访问模式 : ", fo.mode)

输出为:

1
2
3
文件名:  sample.txt
是否已关闭 : False
访问模式 : w

3.3 write()写入文件
write()方法可将任何字符串写入一个打开的文件。需要重点注意的是,Python字符串可以是二进制数据,而不是仅仅是文字。write()方法不会在字符串的结尾添加换行符('\n'),基本语法为:

1
fileObject.write(string)

在这里,被传递的参数是要写入到已打开文件的内容。例如:
1
2
3
4
5
6
# 打开一个文件
# write
fo = open("sample.txt", "w")
fo.write("hello world!\nVery good!\n")
# 关闭打开的文件
fo.close()

上述方法会创建sample.txt文件,并将收到的内容写入该文件,并最终关闭文件。如果你打开这个文件,将看到以下内容:
1
2
hello world!
Very good!

3.4 read()readline()读取文件
read()方法从一个打开的文件中读取一个字符串。需要重点注意的是,Python字符串可以是二进制数据,而不是仅仅是文字。基础语法为:

1
fileObject.read([count])

在这里,被传递的参数是要从已打开文件中读取的字节计数。该方法从文件的开头开始读入,如果没有传入count,它会尝试尽可能多地读取更多的内容,很可能是直到文件的末尾。例如(我们继续使用上一条中创建的sample.txt):
1
2
3
4
5
fo = open("sample.txt", "r+")
str = fo.read(10)
print("读取的字符串是 : ", str)
# 关闭打开的文件
fo.close()

输出为:读取的字符串是 : hello worl

readline()函数是读一行:
例如:

1
2
3
fo = open("sample.txt", "r+")
str_2 = fo.readline()
print(str_2)

输出为:hello world!
也可通过遍历:
1
2
3
fo = open("sample.txt", "r+")
for x in fo:
print(x)

来输出:
1
2
3
hello world!

Very good!

3.5 文件定位tell(),位置改变seek()
tell()方法告诉你文件内的当前位置, 换句话说,下一次的读写会发生在文件开头这么多字节之后。seek(offset [,from])方法改变当前文件的位置。Offset变量表示要移动的字节数。From变量指定开始移动字节的参考位置。例如:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
# tell()、seek()
fo = open("tell.txt", 'w') # 创建文件tell.txt
fo.write("vxiaozhe1998") # 在文件tell.txt中写入vxiaozhe1998
print("当前位置:",fo.tell()) # 输出当前位置
fo = open("tell.txt", "rb+")
# fo.tell() # 将指针移动至当前位置
fo.seek(5, 0) # 将指针以文件开头为参考位置向后移动5
str_1 = fo.read(3)
print("str_1=", str_1)
fo.seek(-2, 1) # 以当前位置为参考向前移动2
str_2 = fo.read(3)
print("str_2=", str_2)
fo.seek(-5, 2) # 以末尾为参考位置向前移动5
str_3 = fo.read(3)
print("str_3=", str_3)

输出为:

1
2
3
4
当前位置: 12
str_1= b'zhe'
str_2= b'he1'
str_3= b'e19'

具体指针操作流程如下:
seek
如果from被设为0,这意味着将文件的开头作为移动字节的参考位置。如果设为1,则使用当前的位置作为参考位置。如果它被设为2,那么该文件的末尾将作为参考位置。

3.6 重命名和删除文件
Python的os模块提供了帮你执行文件处理操作的方法,比如重命名和删除文件。要使用这个模块,你必须先导入它,然后才可以调用相关的各种功能。

  • rename()方法:

语法:

1
2
os.rename(current_file_name, new_file_name)
os.rename(当前文件名,新文件名)

例如:
1
2
3
4
5
6
7
8
9
import os
# 创建文件first.txt
fo = open("first.txt", 'w')
# 在txt文件中添加内容first
fo.write("first")
# 关闭文件
fo.close()
# 更改文件名为second.txt
os.rename("first.txt", "second.txt")

此时在根目录中能够看到一个新文件second.txt,文件中内容为first

  • remove()方法

语法:

1
2
os.remove(file_name)
os.remove(文件名)

rename()代码的基础上我们运行:
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
import os
# 检测文件是否存在
try:
fo=open("second.txt")
print("文件已打开")
fo.close()
except Exception:
print("文件不存在")
# 移除文件second()
os.remove("second.txt")
# 检测文件是否还存在
try:
fo = open("second.txt")
print("文件已打开")
fo.close()
except Exception:
print("文件不存在")

输出为:
1
2
文件已打开
文件不存在

3.8 Python中的目录

  • mkdir()

可以使用os模块的mkdir()方法在当前目录下创建新的目录们。你需要提供一个包含了要创建的目录名称的参数。语法:

1
os.mkdir("newdir")

例如:

1
2
3
import os

os.mkdir("newdir") # 创建新目录

执行代码后将会在脚本位置处生成一个名称为newdir的文件夹。

  • chdir()

可以用chdir()方法来改变当前的目录。chdir()方法需要的一个参数是你想设成当前目录的目录名称。语法:

1
os.chdir("newdir")

例如我们在上文中的newdir文件夹中新建一个newdirs目录,在newdirs目录中新建文本文档index.txt,执行下面代码:

1
2
3
4
5
6
7
8
9
10
11
12
import os
try:
fo =open("index.txt")
print(fo.read())
except Exception:
print("访问失败")
try:
os.chdir("newdir/newdirs")
fo = open("index.txt")
print(fo.read())
except Exception:
print("访问失败")

输出为:

1
2
访问失败
this is index.txt

  • getcwd()

getcwd()方法显示当前的工作目录。语法:

1
os.getcwd()

例如执行下述代码:
1
2
import os
print(os.getcwd())

我们会得到F:\Python\9即为当前脚本所在路径

  • rmdir()

rmdir()方法删除目录,目录名称以参数传递。在删除这个目录之前,它的所有内容应该先被清除。语法:

1
os.rmdir('dirname')

例如:
1
2
3
4
5
6
7
8
9
10
11
12
13
import os
try:
os.mkdir("测试rmdir")
os.chdir("测试rmdir")
print("访问到rmdir目录")
except Exception:
print("rmdir目录不存在")
try:
os.rmdir("测试rmdir")
os.chdir("测试rmdir")
print("访问到rmdir目录")
except Exception:
print("rmdir目录不存在")

输出为:
1
2
访问到rmdir目录
rmdir目录不存在

更多资料


Python OS 文件/目录方法
Python File(文件) 方法


3.9 with()语句
在实际情况中,我们应该尝试使用 with 语句处理文件对象,它会在文件用完后会自动关闭,就算发生异常也没关系。它是 try-finally 块的简写,例如:

1
2
3
with open("sample.txt") as fo:
for line in fo:
print(line, end="")

输出为:
1
2
3
4
hello world!
Very good!
das45 646
1

(sample.txt)中的内容

三、实验内容

1.拷贝文件

我们拷贝给定的文本文件到另一个给定的文本文件。

  • 代码:
1
2
3
4
5
6
7
8
9
# import os
fo = open('a.txt', "w") # 创建新文件a.txt
fo.write("hello2") # 在a.txt中写入hello
fo = open('a.txt', 'r') # 打开a.txt用于读
fq = open('b.txt', 'a') # 创建b.txt用于写入
for line in fo:
fq.write(line) # 将a.txt内容追加至b.txt
fo.close()
fq.close()

通过这段代码,在根目录将生成两个文件,文件名分别为a.txt,b.txt。且两个文件中内容完全相同。

2.文本文件相关信息统计

编写一个程序,对任意给定文本文件中的制表符、行、空格进行计数。

  • 代码(该脚本名称file.py):
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
import os
import sys

def parse_file(path):
"""
分析给定文本文件,返回其空格、制表符、行的相关信息

:arg path: 要分析的文本文件的路径

:return: 包含空格数、制表符数、行数的元组
"""
fd = open(path)
i = 0
spaces = 0
tabs = 0
for i, line in enumerate(fd):
spaces += line.count(' ')
tabs += line.count('\t')
# 现在关闭打开的文件
fd.close()

# 以元组形式返回结果
return spaces, tabs, i + 1


def main(path):
"""
函数用于打印文件分析结果

:arg path: 要分析的文本文件的路径
:return: 若文件存在则为 True,否则 False
"""
if os.path.exists(path):
spaces, tabs, lines = parse_file(path)
print("Spaces {}. tabs {}. lines {}".format(spaces, tabs, lines))
return True
else:
return False


if __name__ == '__main__':
if len(sys.argv) > 1:
main(sys.argv[1])
else:
sys.exit(-1)
sys.exit(0)

使用:

  • 我们在项目根目录创建sample.txt:
    图片描述
  • 输入快捷键Win+R并输入cmd
    图片描述
  • 切换到项目根目录
    图片描述
  • 输入python file.py sample.txt后敲击enter即可运行
    图片描述
  • 拓展:在Pycharm中输入文件名输出文件信息统计
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
import os
import sys

def parse_file(file):
"""
分析给定文本文件,返回其空格、制表符、行的相关信息
:arg path: 要分析的文本文件的路径
:return: 包含空格数、制表符数、行数的元组
"""
i = 0
spaces = 0
tabs = 0
for i, line in enumerate(file):
spaces += line.count(' ')
tabs += line.count('\t')

# 以元组形式返回结果
return spaces, tabs, i + 1

def main(file):
"""
函数用于打印文件分析结果
:arg path: 要分析的文本文件的路径
:return: 若文件存在则为 True,否则 False
"""
if file:
spaces, tabs, lines = parse_file(file)
print("Spaces {}. tabs {}. lines {}".format(spaces, tabs, lines))
return True
else:
return 0
if __name__ == '__main__':
str = input("请输入文件名(包括扩展名):")
file = open(str)
# print(file)
# str_r = file.read()
main(file)
  • 结果:
1
2
请输入文件名(包括扩展名):sample.txt
Spaces 2. tabs 3. lines 4

四、实验结果

1.提取文件中的字符串

我们需要实现一个程序用来提取文件中的字符串中的数字,然后打印输出。

  • 代码:
1
2
3
4
5
6
7
8
str = input("请输入文件名(包括扩展名):")
with open(str) as f:
s = f.read()
res = ""
for char in s:
if char.isdigit():
res += char
print(res)
  • 结果:
1
2
请输入文件名(包括扩展名):sample.txt
456461

注:sample.txt的内容为

1
2
3
4
hello world!
Very good!
das45 646
1


下一篇:10.异常
上一篇:8.函数
目 录:Python学习

本文标题:9.文件处理

文章作者:小哲

发布时间:2020年03月10日 - 23:52

最后更新:2020年03月30日 - 11:41

原始链接: 点击复制原始链接

许可协议: 协议-转载请保留原文链接及作者