文件路径
文件有两个关键属性:“文件名”和“路径”。路径指明了文件在计算机上的位置。
在windows上,路径书写使用倒斜杠作为文件夹之间的分隔符。但在OS X和Linux上,使用正斜杠作为它们的路径分隔符。如果想要程序运行在所有操作系统上,在编写python脚本时,必须处理这两种情况。
如果将单个文件和路径上的文件夹名称的字符串传递给os.path.join()函数,它会返回一个文件路径的字符串,包含正确的路径分隔符。
>>> import os >>> os.path.join(‘usr‘,‘local‘,‘src‘,‘mysql‘) ‘usr/local/src/mysql‘
所有没有从根文件夹开始的文件名或路径,都假定在当前工作目录下。利用os.getcwd()函数,可以取得当前工作路径的字符串,并可以利用os.chdir()改变它。
如果要更改的当前工作目录不存在,python就会显示一个错误。
>>> import os >>> os.getcwd() ‘/root‘ >>> os.chdir(‘/usr/local/‘) >>> os.getcwd() ‘/usr/local‘
可以用os.makedirs()函数创建新目录。它会创建所有必要的中间文件夹,目的是确保完整路径名存在。
>>> import os >>> os.makedirs(‘/tmp/newdir‘)
绝对路径和相对路径
▎有两种方法指定一个文件路径:
“绝对路径”,总是从根文件夹开始。
“相对路径”,它相对于程序的当前工作目录。
"."用作文件夹目录名称时,是“这个目录”的缩写。
".."的意思是父文件夹。
>>> os.getcwd() ‘/usr/local‘ >>> os.chdir(‘./src‘) >>> os.getcwd() ‘/usr/local/src‘
os.path模块
os.path模块包含了许多与文件名和文件路径相关的有用函数。因为os.path是os模块中的模块,所以只要执行import os就可以导入它。
os.path模块提供了一些函数,返回一个相对路径的绝对路径,以及检查给定的路径是否为绝对路径。
调用os.path.abspath(path)将返回参数的绝对路径的字符串。这是将相对路径转换为绝对路径的简便方法。
调用os.path.isabs(path),如果参数是1绝对路径,就返回True,如果参数是一个相对路径,就返回False。
调用os.path.relpath(path,start)将返回从start路径到path的相对路径的字符串。如果没有提供start,就使用当前工作目录为开始路径。
>>> os.path.abspath(‘./src‘) ‘/usr/local/src‘ >>> os.path.isabs(‘./src‘) False >>> os.path.relpath(‘/tmp/‘) ‘../../tmp‘
调用os.path.dirname(path)将返回一个字符串,它包含path参数中最后一个斜杠之前的所有内容。
调用os.path.basename(path)将返回一个字符串,它包含path参数中最后一个斜杠之后的所有内容。
如果同时需要一个路径的目录名称和基本名称,就可以调用os.path.split(),获得这两个字符串的元组。
os.path.split()不会接受一个文件路径并返回每个文件夹的字符串的列表。
split()字符串方法将返回一个列表,包含该路径的所有部分。如果向它传递os.path.sep,就能在所有操作系统上工作。
>>> os.path.dirname(‘/usr/local/src/mysql‘) ‘/usr/local/src‘ >>> os.path.basename(‘/usr/local/src/mysql‘) ‘mysql‘ >>> os.path.split(‘/usr/local/src/mysql‘) (‘/usr/local/src‘, ‘mysql‘)
调用os.path.getsize(path)将返回path参数中文件的字节数。
调用os.listdir(path)将返回文件名字符串的列表,包含path参数中的每个文件。
>>> import os >>> os.path.getsize(‘/tmp/1.txt‘) 1100 >>> os.listdir(‘/tmp/‘) [‘.font-unix‘, ‘.X11-unix‘, ‘.ICE-unix‘, ‘.Test-unix‘, ‘.XIM-unix‘, ‘py.py‘, ‘bigfile‘, ‘yum_save_tx.2017-07-20.09-37.LxNivf.yumtx‘, ‘newdir‘, ‘1.txt‘]
os.path模块提供了一些函数,用于检测给定的路径是否存在,以及它是文件还是文件夹。
如果path参数所指的文件或文件夹存在,调用os.path.exists(path)将返回True,否则返回False。
如果path参数存在,并且是一个文件,调用os.path.isfile(path)将返回True,否则返回False。
如果path参数存在,并且是一个文件夹,调用os.path.isdir(path)将返回True,否则返回False。
利用os.path.exists()函数,可以确定DVD或闪存盘当前是否连在计算机上。
>>> os.path.exists(‘/tmp/1.txt‘) True >>> os.path.isfile(‘/tmp/1.txt‘) True >>> os.path.isdir(‘/tmp/1.txt‘) False
文件读写过程
“纯文本文件”只包含基本文本字符,不包含字体、大小和颜色信息。
“二进制文件”是所有其他文件类型,诸如字处理文档、PDF、图像、电子表格和可执行程序。
▎在python中,读写文件有3个步骤:
1、调用open()函数,返回一个File对象。
2、调用File对象的read()或write()方法。
3、调用File对象的close()方法,关闭该文件。
在python中打开文件时,读模式是默认的模式。“r”表示读模式,“w”表示写模式,“a”表示添加模式。
如果传递给open()的文件名不存在,写模式和添加模式都会创建一个新的空文件。在读取或写入文件后,调用close()方法,然后才能再次打开该文件。
如果将文件内容看成是单个大字符串,read()方法就返回保存在该文件中的这个字符串。
也可以使用readlines()方法,从文件取得一个字符串的列表。列表中每个字符串就是文本的每一行。
write()方法不会像print()函数1,在字符串的末尾自动添加换行字符。必须自己添加该字符。
>>> readfile=open(‘/tmp/1.txt‘) >>> txt=readfile.read() >>> txt ‘123~112313213\nroot:x:0:0:root:/root:/bin/bash\nbin:x:1:1:bin:/bin:/sbin/nologin\ndaemon:x:2:2:daemon:/sbin:/sbin/nologin\nadm:x:3:4:adm:/var/adm:/sbin/nologin\nlp:x:4:7:lp:/var/spool/lpd:/sbin/nologin\nsync:x:5:0:sync:/sbin:/bin/sync\nshutdown:x:6:0:shutdown:/sbin:/sbin/shutdown\nhalt:x:7:0:halt:/sbin:/sbin/halt\nmail:x:8:12:mail:/var/spool/mail:/sbin/nologin\noperator:x:11:0:operator:/root:/sbin/nologin\ngames:x:12:100:games:/usr/games:/sbin/nologin\nftp:x:14:50:FTP User:/var/ftp:/sbin/nologin\nnobody:x:99:99:Nobody:/:/sbin/nologin\nsystemd-bus-proxy:x:999:998:systemd Bus Proxy:/:/sbin/nologin\nsystemd-network:x:192:192:systemd Network Management:/:/sbin/nologin\ndbus:x:81:81:System message bus:/:/sbin/nologin\npolkitd:x:998:997:User for polkitd:/:/sbin/nologin\ntss:x:59:59:Account used by the trousers package to sandbox the tcsd daemon:/dev/null:/sbin/nologin\nsshd:x:74:74:Privilege-separated SSH:/var/empty/sshd:/sbin/nologin\npostfix:x:89:89::/var/spool/postfix:/sbin/nologin\nchrony:x:997:995::/var/lib/chrony:/sbin/nologin\ntcpdump:x:72:72::/:/sbin/nologin\njuispan:x:1000:1000::/home/juispan:/bin/bash\n‘ >>> readfile.close()
保存变量
利用shelve模块,可以将python程序中的变量保存到二进制的shelf文件中。这样,程序就可以从硬盘中恢复变量的数据。
shelve模块等于在程序中添加“保存”和“打开”功能。
shelf值不必用读模式或写模式打开,因为它们在打开后,既能读又能写。
像字典一样,shelf值有keys()和values()方法。会返回类似列表的值,而不是真正的列表。
>>> import shelve >>> shelFile=shelve.open(‘mydata‘) >>> price=[1,2,3] >>> shelFile[‘price‘]=price >>> shelFile.close() >>> shelFile=shelve.open(‘mydata‘) >>> type(shelFile) <class ‘shelve.DbfilenameShelf‘> >>> list(shelFile.keys()) [‘price‘] >>> list(shelFile.values()) [[1, 2, 3]] >>> shelFile[‘price‘] [1, 2, 3] >>> shelFile.close()
可以用pprint.pformat()函数保存变量。
import语句导入的模块本身就是python脚本。
>>> import pprint >>> price=[1,2,3,4,5] >>> pprint.pformat(price) ‘[1, 2, 3, 4, 5]‘ >>> pFile=open(‘pprice.py‘,‘w‘) >>> pFile.write(pprint.pformat(price)) 15 >>> pFile.close()
通过导入pprice.py模块能够查看到文件内容。创建一个.py文件的好处在于,因为它是一个文本文件,所以任何人都可以用一个简单的文本编辑器读取和修改文件的内容。但是,对于大多数应用,利用shelve模块来保存数据,是将变量保存到文件的最佳方式。只有基本数据类型,诸如整型、浮点型、字符串、列表和字典,可以作为简单文本写入一个文件。