python filecmp标准库基础学习

# -*- coding: utf-8 -*-
# 作者:新手
__author__ = ‘Administrator‘
#文件的比较
import os,filecmp
#作用用于比较系统中的目录和文件
#例子2
def mkfile(name,body=None):
    with open(name,‘w‘)as name1:
        name1.write(body or name)
    return
def mk_dir(top):
    if not os.path.exists(top):
        os.mkdir(top)
    curdir=os.getcwd()
    os.chdir(top)
    os.mkdir(‘dir1‘)
    os.mkdir(‘dir2‘)
    mkfile(‘dir1/file_only_in_dir1‘)
    mkfile(‘dir2/file_only_in_dir2‘)
    os.mkdir(‘dir1/file_only_in_dir1‘)
    os.mkdir(‘dir2/file_only_in_dir2‘)
    os.mkdir(‘dir1/common_file‘)
    os.mkdir(‘dir2/common_file‘)
    mkfile(‘dir1/common_file‘,‘this file is the same‘)
    mkfile(‘dir2/common_file‘,‘this file is the same‘)
    mkfile(‘dir1/not_the_same‘)
    mkfile(‘dir2/not_the_same‘)

mkfile(‘dir1/file_in_dir1‘,‘This is a file in dir1‘)
    os.mkdir(‘dir2/file_in_dir1‘)

os.chdir(curdir)
    return
if __name__==‘__main‘:
    os.chdir(os.path.dirname(__file__)or os.getcwd())
    print mk_dir(‘example1‘)
    print mk_dir(‘example1/dir1/common_dir‘)
    print mk_dir(‘example1/dir2/common_dir‘)

#比较目录/文件
print u‘比较:‘,filecmp.cmp(r‘a\a.txt‘,r‘a\b.txt‘,shallow=True)
print u‘比较:‘,filecmp.cmp(r‘a\a.txt‘,r‘a\1.doc‘,shallow=True)
"""
shallow解释:参数它会cmp()除了文件元数据外,是否还要查看文件内容,默认情况下使用os.stat()得到信息完成一个浅比较,而不查看内容,对于同时创建的相同大小文件,如果不比较其内容,会报告错误
如果非递归比较2个目录中一组文件,可以使用cmpfiles(),参数是目录名和2个位置上检查的文件列表
,传入公共文件列表应当只包含文件名(目录会导致匹配不成功),而且这些文件在2个位置上都应当出现,
"""
#例3
d1_contents=set(os.listdir(r‘a‘))
d2_contents=set(os.listdir(r‘a‘))
com=list(d1_contents & d2_contents)
f=[f for f in com if os.path.isfile(os.path.join(r‘a‘,f))]
print f
a,b,c=filecmp.cmpfiles(r‘a‘,r‘a‘,f)
print a,b,c
#comfiles()返回3个文件列表,分别包含匹配文件,不匹配文件和不能比较文件(由于权限或者出于其他原因)
#比较目录:report()会打印比较2个目录的报告
filecmp.dircmp(r‘a‘,r‘a‘).report()
"""
它是输出一个纯文本报告,显示结果只包括给定目录内容,而不会递归比较其子目录,在这边,文件(a)被认为是相同的,因为并没有比较内容,无法让dircmp像cmp()那样比较
想要完成详细的递归比较,可以使用report_full_closure()
"""
filecmp.dircmp(r‘a‘,r‘a‘).report_full_closure()
#将输出包括所有同级子目录的比较

#程序中使用差异
#在请求计算时,对于未使用的数据,创建dircmp实例并不会带来开销
import pprint
dc=filecmp.dircmp(r‘a‘,r‘a‘)
print ‘left:‘,
pprint.pprint(dc.left_list)
print ‘\nrigjt:‘
pprint.pprint(dc.right_list)
#比较目录中包含文件和子目录分别列表left_list和right_list中
#可以向构造函数传入一个要忽略名字列表(该列表中指定的名字将被忽略),对输入进行过滤,默认情况下 ,RCS CVS和tags等名字会被忽略
dc=filecmp.dircmp(r‘a‘,r‘a‘,ignore=[‘common_file‘])
print ‘left1:‘,
pprint.pprint(dc.left_list)
print ‘\nrigjt1:‘
pprint.pprint(dc.right_list)
#‘common_file‘这个会被从文件列表中被删除掉
#2个输入目录共有的文件名会保存在common,各目录独有的文件会在left_only和right_only中
dc=filecmp.dircmp(r‘a‘,r‘a‘)
print ‘left2:‘,
pprint.pprint(dc.left_only)
print ‘\nrigjt2:‘
pprint.pprint(dc.right_only)
#left目录是dircmp()第一个参数,right是第二个参数

#公共成员可以进一步分解为文件,目录和有趣(funny)元素(2个目录中类型不同的内容或者os.stat()指出错误的地方)
dc=filecmp.dircmp(r‘a‘,r‘a‘)
print ‘leftx:‘,
pprint.pprint(dc.common_dirs)
print ‘\nrigjtx:‘
pprint.pprint(dc.common_files)

pprint.pprint(dc.common_funny)
#文件之间的差别可以做类似的划分
dc=filecmp.dircmp(r‘a‘,r‘a‘)
print dc.same_files,dc.diff_files,dc.funny_files
#最后一点,子目录也会保存,从而能窗口地完成递归比较
dc=filecmp.dircmp(r‘a‘,r‘a‘)
print dc.subdirs
#属性subdirs是一个字典,将目录名映射到新的dircmp[对象
#Directories:使用os列出一个目录的内容
#此模块的官方文档:https://docs.python.org/2.7/library/filecmp.html?highlight=filecmp#module-filecmp

时间: 2024-08-22 18:25:08

python filecmp标准库基础学习的相关文章

python linecache标准库基础学习

#python标准库基础之:linecacge:高效读取文本文件#说明与作用"""可以从文件或者导入python模块获取文件,维护一个结果缓存,从而可以更高效地从相同文件读取多行文本;此模块会在python标准库的其他部分中用到,缓存实现将在内存中保存文件内容(解析为单独的行).API通过索引一个列表返回所请求的行.与反复地读取文件并解析文本来查找所需文本行相比,这样可以节省时间,这个方法在查找同一个文件中多行尤其有用 ,比如一个异常."""im

python calendar标准库基础学习

# -*- coding: utf-8 -*-# 作者:新手__author__ = 'Administrator'#标准库:日期时间基础学习:calendar:处理日期#例1import calendarc=calendar.TextCalendar(calendar.SUNDAY)c.prmonth(2015,3)#prmonth()简单函数,生成一个月的格式文件输出#TextCalendar()从星期天(为第一天,因为老外是从星期天开始算第一天的)#利用HTMLCalendar和forma

python StringIO标准库基础学习

#标准库:StringIO提供类文件API文本缓冲区#作用:可以处理内存中的文本,有2种不同的实现:cStringIP版本用c编写提高速度,StringIO用python来提供可移植性,与其他字符串连接相比,cStringIO构造大字符串提供了更好的性能#示例try:    from cStringIO import StringIOexcept:    from  StringIO import StringIO#写入缓冲区out=StringIO()out.write('buffer.')p

python glob标准库基础学习

#glob文件名模式匹配#作用:使用unix shell规则查找与一个模式匹配文件名"""尽管glob api很小,但这个模块很强大,只要程序需要查找文件系统中名字与某种模式匹配一组文件,就可以使用此模块,要创建一个文件名列表,要求其中各个文件名都某个特定的扩展名,前缀或者中间都有某个共同字符串.就可以使用glob而不是编写定制代码来扫描目录内容.glob模式与正则re模式使用正则表达式并不相同,实际上.glob模式遵循标准unix路径扩展规则,只使用几个特殊字符来实现2个不

python os.path标准库基础学习1

#文件系统标准库学习import os,os.pathos.path#平台独立文件/文件名管理#以下给出一些常用的os模块下面使用的方法,如下:"""1:os.sep--路径各部分之间分隔符,如:/,\2:os.extsep 文件名与文件<扩展名>之间分隔符,如:.3:os.pardir 文件路径中表示目录树上一级的部分,如:..4:os.curdir 文件路径指示当前目录部分,如:.5:split()将函数分解成2部分:然后一个元组,这个元组的最后一个路径是第二

C 标准库基础 IO 操作总结

其实输入与输出对于不管什么系统的设计都是异常重要的,比如设计 C 接口函数,首先要设计好输入参数.输出参数和返回值,接下来才能开始设计具体的实现过程.C 语言标准库提供的接口功能很有限,不像 Python 库.不过想把它用好也不容易,本文总结 C 标准库基础 IO 的常见操作和一些特别需要注意的问题,如果你觉着自己还不是大神,那么请相信我,读完全文后你肯定会有不少收获. 一.操作句柄 打开文件其实就是在操作系统中分配一些资源用于保存该文件的状态信息及文件的标识,以后用户程序可以用这个标识做各种读

一、Python的标准库String

一.Python的标准库String 1.查看武器 a. help(type()) name = "jane"print(help(type(name))) b. capitalize() name = "jane" print(name.capitalize()) 效果:Jane c. center() name = "jane" print(name.center(50, '-')) 效果:-----------------------jan

Python 3标准库 第十四章 应用构建模块

Python 3标准库 The Python3 Standard Library by  Example -----------------------------------------第十四章     应用构建模块-----------------------------14.1  argparse:命令行选项和参数解析----------------------------- argparse模块 14.1.1  建立解析器 14.1.2  定义参数 argparse模块 14.1.3 

Python:标准库(包含下载地址及书本目录)

下载地址 中文版(扫描版)请使用迅雷下载 英文版(文字版) 官方文档 The Python Standard Library <Python标准库>一书的目录 <python标准库> 译者序 序 前言 第1章 文本1 1.1 string—文本常量和模板1 1.1.1 函数1 1.1.2 模板2 1.1.3 高级模板4 1.2 textwrap—格式化文本段落6 1.2.1 示例数据6 1.2.2 填充段落6 1.2.3 去除现有缩进7 1.2.4 结合dedent和fill7 1