1. 读取文本文件
代码:
[python] view plain copy
- f = open(‘test.txt‘, ‘r‘)
- print f.read()
- f.seek(0)
- print f.read(14)
- f.seek(0)
- print f.readline()
- print f.readline()
- f.seek(0)
- print f.readlines()
- f.seek(0)
- for line in f:
- print line,
- f.close()
运行结果:
[email protected]:~/python/example# python read_txt.py
第一行
第二行
第三行
第一行
第
第一行
第二行
[‘\xe7\xac\xac\xe4\xb8\x80\xe8\xa1\x8c\n‘, ‘\xe7\xac\xac\xe4\xba\x8c\xe8\xa1\x8c\n‘, ‘\xe7\xac\xac\xe4\xb8\x89\xe8\xa1\x8c\n‘]
第一行
第二行
第三行
open的第二个参数:
- r,读取模式
- w,写入模式
- a,追加模式
- r+,读写模式
read()表示读取到文件尾,size表示读取大小。
seek(0)表示跳到文件开始位置。
readline()逐行读取文本文件。
readlines()读取所有行到列表中,通过for循环可以读出数据。
close()关闭文件。
2. 写入文本文件
代码:
[python] view plain copy
- f = open(‘test.txt‘, ‘r+‘)
- f.truncate()
- f.write(‘0123456789abcd‘)
- f.seek(3)
- print f.read(1)
- print f.read(2)
- print f.tell()
- f.seek(3, 1)
- print f.read(1)
- f.seek(-3, 2)
- print f.read(1)
- f.close()
运行结果:
[email protected]:~/python/example# python write_txt.py
3
45
6
9
b
truncate()表示清空文件
write()写入文本
seek(3)定位到第4个元素前,0表示文件开始,也就是第1个元素前。
seek(3, 1)第二个参数默认是0,表示从文件开始处读取;1表示从当前位置开始计数;2表示从文件最后开始。
read(1)读取一个字节,指针会根据读取的大小移动相应的位置。
tell()取得当前指针的位置。
3. 读取文件信息
[python] view plain copy
- # coding: utf-8
- f = open(‘test.txt‘)
- print ‘文件名:‘, f.name
- print ‘是否处于关闭状态:‘, f.closed
- print ‘打开的模式:‘, f.mode
运行结果:
[email protected]:~/python/example# python read_info.py
文件名: test.txt
是否处于关闭状态: False
打开的模式: r
Python逐行读取文件内容
代码来源: Python参考手册
f = open("foo.txt") # 返回一个文件对象 line = f.readline() # 调用文件的 readline()方法 while line: print line, # 后面跟 ‘,‘ 将忽略换行符 # print(line, end = ‘‘) # 在 Python 3中使用 line = f.readline()f.close()
也可以写成以下更简洁的形式
for line in open("foo.txt"): print line,
更详细的文件按行读取操作可以参考:http://www.cnblogs.com/xuxn/archive/2011/07/27/read-a-file-with-python.html
1. 最基本的读文件方法: ? # File: readline-example-1.py file = open("sample.txt") while 1: line = file.readline() if not line: break pass # do something 一行一行得从文件读数据,显然比较慢;不过很省内存。 在我的机器上读10M的sample.txt文件,每秒大约读32000行 2. 用fileinput模块 ? # File: readline-example-2.py import fileinput for line in fileinput.input("sample.txt"): pass 写法简单一些,不过测试以后发现每秒只能读13000行数据,效率比上一种方法慢了两倍多…… 3. 带缓存的文件读取 ? # File: readline-example-3.py file = open("sample.txt") while 1: lines = file.readlines(100000) if not lines: break for line in lines: pass # do something 这个方法真的更好吗?事实证明,用同样的数据测试,它每秒可以读96900行数据!效率是第一种方法的3倍,第二种方法的7倍! ———————————————————————————————————————————————————————————— 在Python 2.2以后,我们可以直接对一个file对象使用for循环读每行数据: ? # File: readline-example-5.py file = open("sample.txt") for line in file: pass # do something 而在Python 2.1里,你只能用xreadlines迭代器来实现: ? # File: readline-example-4.py file = open("sample.txt") for line in file.xreadlines(): pass # do something 翻译自:http://hi.baidu.com/netspider_2007/blog/item/870354c753e4a71c9c163d64.html