python之旅:文件处理

一 文件操作及理论

一 介绍

计算机系统分为:计算机硬件、操作系统、应用程序三部分
我们用python或者其他程序,想要把数据永久的保存下来,就得写到硬盘里,但是应用程序是没有办法直接操作硬件的,这就用到了操作系统。
操作系统把复杂的硬件操作封成简单的接口给用户使用,其中文件就是操作系统提供给应用程序来操作硬盘虚拟概念,用户用程序通过系统操作文件,就可以报数据保存到硬盘中了

有了文件的概念,我们无需再去考虑操作硬盘的细节,只需要关注操作文件的流程:

#1. 打开文件,得到文件句柄并赋值给一个变量
#2. 通过句柄对文件进行操作
#3. 关闭文件

二 在python中如何操作文件

#1. 打开文件,得到文件句柄并赋值给一个变量
f=open(‘a.txt‘,‘r‘,encoding=‘utf-8‘) #默认打开模式就为rt r只读 t文本 t可以不写,默认打开文本

#2. 通过句柄对文件进行操作
data=f.read()

#3. 关闭文件
f.close()

三 f=open(‘a.txt‘,‘r‘)的过程分析

#1、由应用程序向操作系统发起系统调用open(...)

#2、操作系统打开该文件,并返回一个文件句柄给应用程序

#3、应用程序将文件句柄赋值给变量f

四 强调!!!

#强调第一点:
打开一个文件包含两部分资源:操作系统级打开的文件+应用程序的变量。在操作完毕一个文件时,必须把与该文件的这两部分资源一个不落地回收,回收方法为:
1、f.close() #回收操作系统级打开的文件
2、del f #回收应用程序级的变量

其中del f一定要发生在f.close()之后,否则就会导致操作系统打开的文件还没有关闭,白白占用资源,
而python自动的垃圾回收机制决定了我们无需考虑del f,这就要求我们,在操作完毕文件后,一定要记住f.close()

虽然我这么说,但是很多同学还是会很不要脸地忘记f.close(),对于这些不长脑子的同学,我们推荐傻瓜式操作方式:使用with关键字来帮我们管理上下文
with open(‘a.txt‘,‘w‘) as f:
    pass

with open(‘a.txt‘,‘r‘) as read_f,open(‘b.txt‘,‘w‘) as write_f:
    data=read_f.read()
    write_f.write(data)
#强调第二点:
f=open(...)是由操作系统打开文件,那么如果我们没有为open指定编码,那么打开文件的默认编码很明显是操作系统说了算了,操作系统会用自己的默认编码去打开文件,在windows下是gbk,在linux下是utf-8。
这就用到了上节课讲的字符编码的知识:若要保证不乱码,文件以什么方式存的,就要以什么方式打开。

f=open(‘a.txt‘,‘r‘,encoding=‘utf-8‘)

五 python2中的file与open

#首先在python3中操作文件只有一种选择,那就是open()

#而在python2中则有两种方式:file()与open()
两者都能够打开文件,对文件进行操作,也具有相似的用法和参数,但是,这两种文件打开方式有本质的区别,file为文件类,用file()来打开文件,相当于这是在构造文件类,而用open()打开文件,是用python的内建函数来操作,我们一般使用open()打开文件进行操作,而用file当做一个类型,比如type(f) is file

三 操作文件的方法

我们先来看看函数open(),要以任何方式使用文件———— 哪怕仅仅是打印其内容,都得先打开文件,这样才能访问他。

关键字with在不再需要访问文件后将其关闭。

你也调用open()和close()来打开和关闭文件,但这样做时,如果程序存在bug,导致close()语句未执行,文件将不会关闭(因为程序打开文件时通知系统打开的,所以关闭时也应该通知系统,档程序不告诉系统关闭文件时,系统会通过一定的周期确定文件没有被调用时,再将其关闭,系统打开文件的数量是有限制的。程序不需要访问文件时应通知系统关闭文件,减少两方资源消耗,虽然都会拉垃圾自动回收)。也许在你看起来微不足道,但未妥善的关闭文件可能会导致数据丢失或损失。如果过早的调用close(),你会发现文件已关闭,这会导致更多的错误。但是通过with,可以让pytho去确定:你只管打开文件,并在需要时使用它,python自会在何时的时候自动将其关闭。

#掌握
f.read() #读取所有内容,光标移动到文件末尾
f.readline() #读取一行内容,光标移动到第二行首部
f.readlines() #读取每一行内容,存放于列表中

f.write(‘1111\n222\n‘) #针对文本模式的写,需要自己写换行符
f.write(‘1111\n222\n‘.encode(‘utf-8‘)) #针对b模式的写,需要自己写换行符
f.writelines([‘333\n‘,‘444\n‘]) #文件模式
f.writelines([bytes(‘333\n‘,encoding=‘utf-8‘),‘444\n‘.encode(‘utf-8‘)]) #b模式

#了解
f.readable() #文件是否可读
f.writable() #文件是否可读
f.closed #文件是否关闭
f.encoding #如果文件打开模式为b,则没有该属性
f.flush() #立刻将文件内容从内存刷到硬盘
f.name

一 读取文件

1、 读取整个文件 read()

我们先来看看函数open(),要以任何方式使用文件————哪怕仅仅是打印其内容,都得先打开文件,这样才能访问他。

关键字with在不再需要访问文件后将其关闭。

你也跳用open()和close()来打开和关闭文件,但这样做时,如果程序存在bug,导致close()语句未执行,文件将不会关闭(因为程序打开文件时通知系统打开的,所以关闭时也应该通知系统,档程序不告诉系统关闭文件时,系统会通过一定的周期确定文件没有被调用时,再将其关闭,系统打开文件的数量是有限制的。程序不需要访问文件时应通知系统关闭文件,减少两方资源消耗,虽然都会拉垃圾自动回收)。也许在你看起来微不足道,但未妥善的关闭文件可能会导致数据丢失或损失。如果过早的调用close(),你会发现文件已关闭,这会导致更多的错误。但是通过with,可以让pytho去确定:你只管打开文件,并在需要时使用它,python自会在何时的时候自动将其关闭。

a.txt 内容如下:
饿饿饿饿饿饿饿饿1
饿饿饿饿饿饿饿饿2
饿饿饿饿饿饿饿饿3
with open(‘a.txt‘,mode=‘r‘,encoding=‘utf-8‘) as f:
    print(f.read())结果:饿饿饿饿饿饿饿饿1饿饿饿饿饿饿饿饿2饿饿饿饿饿饿饿饿

2、 逐行读取 readline()

1、通过for循环实现with open(‘a.txt‘,mode=‘rt‘,encoding=‘utf-8‘) as f: #以上说过默认rt,r只读,t文本
    for line in f:
        print(line)结果如下:
饿饿饿饿饿饿饿饿1

饿饿饿饿饿饿饿饿2

饿饿饿饿饿饿饿饿3#因为print()自带换行,如果你不想让其换行,你可以print(line,end=‘‘)

2、通过readline()函数   f.readline() #读取一行内容,光标移动到第二行首部
with open(‘a.txt‘,mode=‘rt‘,encoding=‘utf-8‘) as f:    print(f.readline())    print(f.readline())    print(f.readline())

3、创建一个包含文件各行内容的列表 readlines()

在使用关键字with时,open()返回的文件对象只在with代码块内使用。如果要在with代码块外使用,可在with代码块内将文件的各行存储在一个列表中,并在with代码块外使用该列表:你可以立即处理文件的各个部分,也可以推迟到程序后面在处理。

#文件过大时,不建议使用此方法,因为这都是要读到内存中的,你也不想内存溢出崩溃吧!with open(‘a.txt‘,mode=‘r‘,encoding=‘utf-8‘) as f:
    lines=f.readlines()
    print(lines)   #这是故意打印出来让大家看的
for line in lines:
    print(line.rstrip())   #rstrip() 删除 string 字符串末尾的指定字符(默认为空格)结果如下:[‘饿饿饿饿饿饿饿饿1\n‘, ‘饿饿饿饿饿饿饿饿2\n‘, ‘饿饿饿饿饿饿饿饿3\n‘]  #这是lines的结果饿饿饿饿饿饿饿饿1      #这是line的结果

饿饿饿饿饿饿饿饿2

饿饿饿饿饿饿饿饿

二 写入文件 .write

保存数据最简单的方式之一是将其写入到文件中。

1、 写入空文件

  要将文本写入文件,你在调用open()时需要提供另一个实参,告诉python你要写入打开的文件。

也就是说  注意:# 1、当文件存在时,清空   # 2、当文件不存在时,创建空文档  #3、也就是说不管怎么养都相当于创建了个空文件然后写入内容

with open(‘a.txt‘,mode=‘w‘,encoding=‘utf-8‘) as f:
    f.write(‘I love Python‘)结果如下:I love Python  #这是现在a.txt文件的内容,他本来是有其他内容的,看上述

2、附加到文件

  你要给文件添加内容,而不是覆盖原有的内容,你可已附加模式打开文件。

  你以附加模式打开文件时,Python不会在返回文件对象前清空文件,而你写入的文件内容都将追加到末尾。

  如果指定的文件不存在时,将会创建一个空文件。

with open(‘a.txt‘,mode=‘a‘,encoding=‘utf-8‘) as f:
    f.write(‘\nI love Money\n‘)
    f.write("I love Music\n")结果如下:
I love Python   #a.txt本就存在的内容I love MoneyI love Music

3、同时插入多个字符串 .writelines

with open(‘a.txt‘,mode=‘a‘,encoding=‘utf-8‘) as f:
    f.writelines([‘qeqwe\n‘,‘qweadqe\n‘])

结果如下:
I love PythonI love MoneyI love Musicqeqwe  #追加的qweadqe  #追加的

  

原文地址:https://www.cnblogs.com/moyand/p/8626269.html

时间: 2024-10-10 09:44:39

python之旅:文件处理的相关文章

开始 Python 之旅

开始 Python 之旅 课程来源 本课程基于 Python for you and me 教程翻译制作,其中参考了 Python tutorial 和 The Python Standard Library,并对原教程的内容进行了改进与补充. 相关链接地址如下: Python tutorial:http://www.pythondoc.com/pythontutorial3/index.html Python for you and me:http://pymbook.readthedocs.

day1-开启python之旅

1.python安装Anaconda安装地址:https://www.anaconda.com/2.Pycharm安装 Pycharm安装地址:https://www.jetbrains.com/pycharm/3.安装环境测试 python3.6.2+Pycharm:4.建立项目及新建.py文件并打印输输出 print('hello world') 准备就绪,开始python之旅吧 原文地址:http://blog.51cto.com/13803166/2128333

python处理word文件:win32com用法详解

目标:用python处理doc文件 方法:引入win32com模块 ************************************************************************** 一.安装 ************************************************************************** 首先要先下载安装win32com模块(起先在linux下装不成功,后在windows下面成功了...) 下载地址:http

Python 基础 - Json文件读写

JSON介绍 JSON(JavaScript Object Notation) 是一种轻量级的数据交换格式.它基于ECMAScript的一个子集. JSON采用完全独立于语言的文本格式,但是也使用了类似于C语言家族的习惯(包括C.C++.Java.JavaScript.Perl.Python等).这些特性使JSON成为理想的数据交换语言.易于人阅读和编写,同时也易于机器解析和生成(一般用于提升网络传输速率). 在python中,JSON 由列表和字典组成. 序列化的两个模块中,json模块是用于

python解析json文件

概念 序列化(Serialization):将对象的状态信息转换为可以存储或可以通过网络传输的过程,传输的格式可以是JSON.XML等.反序列化就是从存储区域(JSON,XML)读取反序列化对象的状态,重新创建该对象. JSON(JavaScript Object Notation):一种轻量级数据交换格式,相对于XML而言更简单,也易于阅读和编写,机器也方便解析和生成,Json是JavaScript中的一个子集. Python2.6开始加入了JSON模块,无需另外下载,Python的Json模

Python学习_06_文件、IO

文件对象 python中的文件操作和c语言比较类似,包括一些缓冲.偏移量的方式. 文件对象可以通过open().file()两个内建方法创建,两个方法并没有什么不同,使用方法和c语言中的fopen()类似: file_object = open(file_name, access_mode='r', buffering=-1) 其中access_mode表示打开方式,r表示只读,w表示只写,r+,w+表示读写,a表示追加等:buffering表示缓冲方式,负值表示默认缓冲方式,0表示不缓冲,1表

Python读取txt文件

Python读取txt文件,有两种方式: (1)逐行读取 1 data=open("data.txt") 2 line=data.readline() 3 while line: 4 print line 5 line=data.readline() (2)一次全部读入内存 1 data=open("data.txt") 2 for line in data.readlines(): 3 print line

python读取excel文件(xrld模块)

Python读取excel文件 一.python  xlrd模块 安装 mac 下安装python  xlrd模块 http://www.crifan.com/python_read_excel_xls_file_xlrd/comment-page-1/ python setup.py install 在mac 下出现的错误是 http://stackoverflow.com/questions/18199853/error-could-not-create-library-python-2-7

python 之删除文件

import os #引处系统模块 os.remove(filename) #删除这个文件,可以有路径. python 之删除文件,布布扣,bubuko.com

[Python]处理压缩文件

这里讨论使用Python解压如下五种压缩文件: .gz .tar  .tgz .zip .rar 简介 gz: 即gzip,通常只能压缩一个文件.与tar结合起来就可以实现先打包,再压缩. tar: linux系统下的打包工具,只打包,不压缩 tgz:即tar.gz.先用tar打包,然后再用gz压缩得到的文件 zip: 不同于gzip,虽然使用相似的算法,可以打包压缩多个文件,不过分别压缩文件,压缩率低于tar. rar:打包压缩文件,最初用于DOS,基于window操作系统.压缩率比zip高,