9.文件处理

在本文中将提供Python中的文件操作

一、实验目的

文件打开与关闭
文件读取与写入

二、知识要点

1.打印到屏幕

1	print("Python 是一个非常棒的语言，不是吗？")

输出为：Python 是一个非常棒的语言，不是吗？

2.读取键盘输入

raw_input:raw_input([prompt]) 函数从标准输入读取一个行，并返回一个字符串（去掉结尾的换行符）,例如：

1 2	str = raw_input("请输入：") print("你输入的内容是: ", str)

输出为：

1 2	请输入：Hello Python！你输入的内容是: Hello Python！

input():input([prompt]) 函数和 raw_input([prompt]) 函数基本类似，但是 input 可以接收一个Python表达式作为输入，并将运算结果返回。例如：

1 2	str = input("请输入：") print("你输入的内容是: ", str)

这会产生如下的对应着输入的结果：

1 2	请输入：[x*5 for x in range(2,10,2)] 你输入的内容是: [10, 20, 30, 40]

3.文件操作

3.1 open()打开文件
用Python内置的open()函数打开一个文件，创建一个file对象，相关的方法才可以调用它进行读写。语法如下：

1	file object = open(file_name [, access_mode][, buffering])

各个参数详解：

file_name：file_name变量是一个包含了你要访问的文件名称的字符串值。
access_mode：access_mode决定了打开文件的模式：只读，写入，追加等。所有可取值见如下的完全列表。这个参数是非强制的，默认文件访问模式为只读(r)。
buffering:如果buffering的值被设为0，就不会有寄存。如果buffering的值取1，访问文件时会寄存行。如果将buffering的值设为大于1的整数，表明了这就是的寄存区的缓冲大小。如果取负值，寄存区的缓冲大小则为系统默认。

不同模式下打开文件的列表如下：

点击显/隐表格

模式	描述
t	文本模式 (默认)。
x	写模式，新建一个文件，如果该文件已存在则会报错。
b	二进制模式。
+	打开一个文件进行更新(可读可写)。
U	通用换行模式（不推荐）。
r	以只读方式打开文件。文件的指针将会放在文件的开头。这是默认模式。
rb	以二进制格式打开一个文件用于只读。文件指针将会放在文件的开头。这是默认模式。一般用于非文本文件如图片等。
r+	打开一个文件用于读写。文件指针将会放在文件的开头。
rb+	以二进制格式打开一个文件用于读写。文件指针将会放在文件的开头。一般用于非文本文件如图片等。
w	打开一个文件只用于写入。如果该文件已存在则打开文件，并从开头开始编辑，即原有内容会被删除。如果该文件不存在，创建新文件。
wb	以二进制格式打开一个文件只用于写入。如果该文件已存在则打开文件，并从开头开始编辑，即原有内容会被删除。如果该文件不存在，创建新文件。一般用于非文本文件如图片等。
w+	打开一个文件用于读写。如果该文件已存在则打开文件，并从开头开始编辑，即原有内容会被删除。如果该文件不存在，创建新文件。
wb+	以二进制格式打开一个文件用于读写。如果该文件已存在则打开文件，并从开头开始编辑，即原有内容会被删除。如果该文件不存在，创建新文件。一般用于非文本文件如图片等。
a	打开一个文件用于追加。如果该文件已存在，文件指针将会放在文件的结尾。也就是说，新的内容将会被写入到已有内容之后。如果该文件不存在，创建新文件进行写入。
ab	以二进制格式打开一个文件用于追加。如果该文件已存在，文件指针将会放在文件的结尾。也就是说，新的内容将会被写入到已有内容之后。如果该文件不存在，创建新文件进行写入。
a+	打开一个文件用于读写。如果该文件已存在，文件指针将会放在文件的结尾。文件打开时会是追加模式。如果该文件不存在，创建新文件用于读写。
ab+	以二进制格式打开一个文件用于追加。如果该文件已存在，文件指针将会放在文件的结尾。如果该文件不存在，创建新文件用于读写。

对于不同模式的可用操作如下表所示：

模式	r	r+	w	w+	a	a+
读	+	+		+		+
写		+	+	+	+	+
创建			+	+	+	+
覆盖			+	+
指针在开始	+	+	+	+
指针在结尾					+	+

3.2 close()关闭文件
File对象的 close（）方法刷新缓冲区里任何还没写入的信息，并关闭该文件，这之后便不能再进行写入。当一个文件对象的引用被重新指定给另一个文件时，Python 会关闭之前的文件。用 close（）方法关闭文件是一个很好的习惯。基本语法：

1	fileObject.close()

例如：

# 打开一个文件
fo = open("foo.txt", "w")
print("文件名: ", fo.name)
# 关闭打开的文件
fo.close()

输出：文件名: foo.txt

拓展：File对象的属性
一个文件被打开后，你有一个file对象，你可以得到有关该文件的各种信息。以下是和file对象相关的所有属性的列表：

属性	描述
file.closed	返回true如果文件已被关闭，否则返回false。
file.mode	返回被打开文件的访问模式。
file.name	返回文件的名称。

例如,首先在根目录下创建文件sample.txt,然后执行程序：

fo = open("sample.txt", "w")
print("文件名: ", fo.name)
print("是否已关闭 : ", fo.closed)
print("访问模式 : ", fo.mode)

输出为：

1
2
3

文件名:  sample.txt
是否已关闭 :  False
访问模式 :  w

3.3 write()写入文件
write()方法可将任何字符串写入一个打开的文件。需要重点注意的是，Python字符串可以是二进制数据，而不是仅仅是文字。write()方法不会在字符串的结尾添加换行符('\n'),基本语法为：

1	fileObject.write(string)

在这里，被传递的参数是要写入到已打开文件的内容。例如：

# 打开一个文件
# write
fo = open("sample.txt", "w")
fo.write("hello world!\nVery good!\n")
# 关闭打开的文件
fo.close()

上述方法会创建sample.txt文件，并将收到的内容写入该文件，并最终关闭文件。如果你打开这个文件，将看到以下内容:

1 2	hello world! Very good!

3.4 read()和readline()读取文件
read（）方法从一个打开的文件中读取一个字符串。需要重点注意的是，Python字符串可以是二进制数据，而不是仅仅是文字。基础语法为：

1	fileObject.read([count])

在这里，被传递的参数是要从已打开文件中读取的字节计数。该方法从文件的开头开始读入，如果没有传入count，它会尝试尽可能多地读取更多的内容，很可能是直到文件的末尾。例如（我们继续使用上一条中创建的sample.txt)：

fo = open("sample.txt", "r+")
str = fo.read(10)
print("读取的字符串是 : ", str)
# 关闭打开的文件
fo.close()

输出为：读取的字符串是 : hello worl

而readline()函数是读一行：
例如：

1
2
3

fo = open("sample.txt", "r+")
str_2 = fo.readline()
print(str_2)

输出为：hello world!
也可通过遍历：

1
2
3

fo = open("sample.txt", "r+")
for x in fo:
    print(x)

来输出：

1
2
3

hello world!

Very good!

3.5 文件定位tell()，位置改变seek()
tell()方法告诉你文件内的当前位置, 换句话说，下一次的读写会发生在文件开头这么多字节之后。seek（offset [,from]）方法改变当前文件的位置。Offset变量表示要移动的字节数。From变量指定开始移动字节的参考位置。例如：

# tell()、seek()
fo = open("tell.txt", 'w')  # 创建文件tell.txt
fo.write("vxiaozhe1998")  # 在文件tell.txt中写入vxiaozhe1998
print("当前位置：",fo.tell())  # 输出当前位置
fo = open("tell.txt", "rb+")
# fo.tell()  # 将指针移动至当前位置
fo.seek(5, 0)  # 将指针以文件开头为参考位置向后移动5
str_1 = fo.read(3)
print("str_1=", str_1)
fo.seek(-2, 1)  # 以当前位置为参考向前移动2
str_2 = fo.read(3)
print("str_2=", str_2)
fo.seek(-5, 2)  # 以末尾为参考位置向前移动5
str_3 = fo.read(3)
print("str_3=", str_3)

输出为：

当前位置： 12
str_1= b'zhe'
str_2= b'he1'
str_3= b'e19'

具体指针操作流程如下：

如果from被设为0，这意味着将文件的开头作为移动字节的参考位置。如果设为1，则使用当前的位置作为参考位置。如果它被设为2，那么该文件的末尾将作为参考位置。

3.6 重命名和删除文件
Python的os模块提供了帮你执行文件处理操作的方法，比如重命名和删除文件。要使用这个模块，你必须先导入它，然后才可以调用相关的各种功能。

rename()方法：

语法：

1 2	os.rename(current_file_name, new_file_name) os.rename(当前文件名，新文件名)

例如：

import os
# 创建文件first.txt
fo = open("first.txt", 'w')
# 在txt文件中添加内容first
fo.write("first")
# 关闭文件
fo.close()
# 更改文件名为second.txt
os.rename("first.txt", "second.txt")

此时在根目录中能够看到一个新文件second.txt,文件中内容为first

remove()方法

语法：

1 2	os.remove(file_name) os.remove(文件名)

在rename()代码的基础上我们运行：

import os
# 检测文件是否存在
try:
    fo=open("second.txt")
    print("文件已打开")
    fo.close()
except Exception:
    print("文件不存在")
# 移除文件second()
os.remove("second.txt")
# 检测文件是否还存在
try:
    fo = open("second.txt")
    print("文件已打开")
    fo.close()
except Exception:
    print("文件不存在")

输出为：

1 2	文件已打开文件不存在

3.8 Python中的目录

mkdir()

可以使用os模块的mkdir()方法在当前目录下创建新的目录们。你需要提供一个包含了要创建的目录名称的参数。语法：

1	os.mkdir("newdir")

例如：

1
2
3

import os

os.mkdir("newdir")  # 创建新目录

执行代码后将会在脚本位置处生成一个名称为newdir的文件夹。

chdir()

可以用chdir()方法来改变当前的目录。chdir()方法需要的一个参数是你想设成当前目录的目录名称。语法：

1	os.chdir("newdir")

例如我们在上文中的newdir文件夹中新建一个newdirs目录，在newdirs目录中新建文本文档index.txt，执行下面代码：

import os
try:
    fo =open("index.txt")
    print(fo.read())
except Exception:
    print("访问失败")
try:
    os.chdir("newdir/newdirs")
    fo = open("index.txt")
    print(fo.read())
except Exception:
    print("访问失败")

输出为：

1 2	访问失败 this is index.txt

getcwd()

getcwd()方法显示当前的工作目录。语法：

1	os.getcwd()

例如执行下述代码：

1 2	import os print(os.getcwd())

我们会得到F:\Python\9即为当前脚本所在路径

rmdir()

rmdir()方法删除目录，目录名称以参数传递。在删除这个目录之前，它的所有内容应该先被清除。语法：

1	os.rmdir('dirname')

例如：

import os
try:
    os.mkdir("测试rmdir")
    os.chdir("测试rmdir")
    print("访问到rmdir目录")
except Exception:
    print("rmdir目录不存在")
try:
    os.rmdir("测试rmdir")
    os.chdir("测试rmdir")
    print("访问到rmdir目录")
except Exception:
    print("rmdir目录不存在")

输出为：

1 2	访问到rmdir目录 rmdir目录不存在

更多资料

Python OS 文件/目录方法
 Python File(文件) 方法

3.9 with()语句
在实际情况中，我们应该尝试使用 with 语句处理文件对象，它会在文件用完后会自动关闭，就算发生异常也没关系。它是 try-finally 块的简写，例如：

1
2
3

with open("sample.txt") as fo:
    for line in fo:
        print(line, end="")

输出为：

hello world!
Very good!
das45			646
1

(sample.txt)中的内容

三、实验内容

1.拷贝文件

我们拷贝给定的文本文件到另一个给定的文本文件。

代码：

# import os
fo = open('a.txt', "w")  # 创建新文件a.txt
fo.write("hello2")  # 在a.txt中写入hello
fo = open('a.txt', 'r')  # 打开a.txt用于读
fq = open('b.txt', 'a')  # 创建b.txt用于写入
for line in fo:
    fq.write(line)  # 将a.txt内容追加至b.txt
fo.close()
fq.close()

通过这段代码，在根目录将生成两个文件，文件名分别为a.txt,b.txt。且两个文件中内容完全相同。

2.文本文件相关信息统计

编写一个程序，对任意给定文本文件中的制表符、行、空格进行计数。

代码(该脚本名称file.py)：

import os
import sys

def parse_file(path):
    """
    分析给定文本文件，返回其空格、制表符、行的相关信息

    :arg path: 要分析的文本文件的路径
    
    :return: 包含空格数、制表符数、行数的元组
    """
    fd = open(path)
    i = 0
    spaces = 0
    tabs = 0
    for i, line in enumerate(fd):
        spaces += line.count(' ')
        tabs += line.count('\t')
    # 现在关闭打开的文件
    fd.close()
    
    # 以元组形式返回结果
    return spaces, tabs, i + 1


def main(path):
    """
    函数用于打印文件分析结果

    :arg path: 要分析的文本文件的路径
    :return: 若文件存在则为 True，否则 False
    """
    if os.path.exists(path):
        spaces, tabs, lines = parse_file(path)
        print("Spaces {}. tabs {}. lines {}".format(spaces, tabs, lines))
        return True
    else:
        return False


if __name__ == '__main__':
    if len(sys.argv) > 1:
        main(sys.argv[1])
    else:
        sys.exit(-1)
    sys.exit(0)

使用：

我们在项目根目录创建sample.txt:

输入快捷键Win+R并输入cmd

切换到项目根目录

输入python file.py sample.txt后敲击enter即可运行

拓展：在Pycharm中输入文件名输出文件信息统计

import os
import sys

def parse_file(file):
    """
    分析给定文本文件，返回其空格、制表符、行的相关信息
    :arg path: 要分析的文本文件的路径
    :return: 包含空格数、制表符数、行数的元组
    """
    i = 0
    spaces = 0
    tabs = 0
    for i, line in enumerate(file):
        spaces += line.count(' ')
        tabs += line.count('\t')
   
    # 以元组形式返回结果
    return spaces, tabs, i + 1

def main(file):
    """
    函数用于打印文件分析结果
    :arg path: 要分析的文本文件的路径
    :return: 若文件存在则为 True，否则 False
    """
    if file:
        spaces, tabs, lines = parse_file(file)
        print("Spaces {}. tabs {}. lines {}".format(spaces, tabs, lines))
        return True
    else:
        return 0
if __name__ == '__main__':
    str = input("请输入文件名（包括扩展名）：")
    file = open(str)
    # print(file)
    # str_r = file.read()
    main(file)

结果:

1 2	请输入文件名（包括扩展名）：sample.txt Spaces 2. tabs 3. lines 4

四、实验结果

1.提取文件中的字符串

我们需要实现一个程序用来提取文件中的字符串中的数字，然后打印输出。

代码：

str = input("请输入文件名（包括扩展名）：")
with open(str) as f:
    s = f.read()
res = ""
for char in s:
    if char.isdigit():
        res += char
print(res)

结果：

1 2	请输入文件名（包括扩展名）：sample.txt 456461

注：sample.txt的内容为

hello world!
Very good!
das45			646
1

下一篇：10.异常
上一篇：8.函数
目录：Python学习

一、实验目的

二、知识要点

1.打印到屏幕

2.读取键盘输入

3.文件操作

123文件名: sample.txt是否已关闭 : False访问模式 : w

三、实验内容

1.拷贝文件

2.文本文件相关信息统计

四、实验结果

1.提取文件中的字符串

1
2
3
文件名: sample.txt
是否已关闭 : False
访问模式 : w