小事牛刀之——python做文件对比

使用python对比filename1和filenam2的差异,并将差异写入到filename3中。

#!/usr/bin/env python
# -*- coding: utf-8 -*-
# @File  : file_diff.py
# @Author: Maxwell Yang ([email protected])
# @Date  : 2018/4/10
# @Desc  : 从文件2中去除掉在文件1中有的行,生成文件3

filename1 = input(‘请输入需要剔除内容的文件路径:‘)
filename2 = input(‘请输入作为对比的文件路径:‘)
filename3 = input(‘请输入存放2文件差异的文件路径:‘)

f1 = open(filename1,‘r‘)
f2 = open(filename2,‘r‘)
f3 = open(filename3,‘w‘)

list1 = list(f1)
list2 = list(f2)
list3 = []

for each in list2:
    #print(each)
    if each not in list1:
        list3.append(each)

for item in list3:
    f3.write(item)

f1.close()
f2.close()
f3.close()

原文地址:https://www.cnblogs.com/maxyang2008/p/9031378.html

时间: 2024-10-14 05:42:34

小事牛刀之——python做文件对比的相关文章

Python按行读文件对比

1. 最基本的读文件方法: # File: readline-example-1.py file = open("sample.txt") while 1:     line = file.readline()     if not line:         break     pass # do something 一行一行得从文件读数据,显然比较慢:不过很省内存. 在我的机器上读10M的sample.txt文件,每秒大约读32000行 2. 用fileinput模块 # File

Python文件对比

环境: python2.6.6 linux系统 对比文件差异用Python里的difflib模块: Python自带difflib模块,无需安装. 对比两个文件是否一样总体思路就是:将文件里的内容读出来然后再对比 符号 含义 + 包含在第二个序列中,但不包含第一个序列中 - 包含在第一个序列中,但不包含第二个序列中 ? 标志两个序列行存在增量差异 ^ 标志两个序列存在的差异字符 '' 两个序列行一致 示例一: #!/usr/bin/python #coding:utf-8 #2017,8,27

Python练习【7】【文件对比并输出可读性较强的html文件】

题目: 利用python写出一个可在shell中执行的命令mydiff,用于比对两个文件之间的区别,输出可读性较强的html页面源码,可保存到html文件中进行查看. 格式: mydiff file1 file2 [> save_file] 实现: 1.利用sys.argv函数获取从命令行输入的参数,用于传递参数 if len(sys.argv) !=3: # 如果参数数量不为3个输出命令的使用提示 print(''' usage: {} file1 file2 [>] [file to sa

(python功能定制)复杂的xml文件对比,产生HTML展示区别

功能的设计初衷: 处理复杂的xml对比,屏蔽同节点先后顺序的影响 主要涉及知识点: 1.xml解析 ------- ElementTree库 2.文件比对差别 ------- difflib库 3.获取当前系统 -------- platform库 4.如果使用robot framework,可以看到明显区别,可以定制日志log显示-------- logger库 遗憾与待优化: 其中有一部分内容,原先准备采用自循环的方式处理,但是过程中的数据传输有点复杂,以后会考虑把这部分优化一下. ####

搜索引擎--范例:django之初试牛刀

这学期学了一门课<信息检索>,也就是传说中的搜索引擎 大作业自然而然的让我们自己做一个小型的搜索引擎.于是乎,我们本次的主题就诞生了 我也是边学边用,下面和大家一起分享我在这个过程中学到的东西,说的不对的请大家指正 这是我的成果搜索引擎--范例,大家可以点进去看看,点此下载所有文件盒源代码 按照流程,下面我给大家分享的依次是: 1:SAE创建新应用,SVN管理代码 2:新浪微博API获取最近的微博 3:中文分词算法的实现 4:谈谈django--mysql数据库的一些常用命令 搜索引擎--范例

Python 操作文件模拟SQL语句功能

Python操作文件模拟SQL语句功能 一.需求 当然此表你在文件存储时可以这样表示 1,Alex Li,22,13651054608,IT,2013-04-01 现需要对这个员工信息文件,实现增删改查操作 1. 可进行模糊查询,语法至少支持下面3种: 1. select name,age from staff_table where age > 22 2. select * from staff_table where dept = "IT" 3. select * from

Go/Python/Erlang编程语言对比分析及示例

本文主要是介绍Go,从语言对比分析的角度切入.之所以选择与Python.Erlang对比,是因为做为高级语言,它们语言特性上有较大的相似性,不过最主要的原因是这几个我比较熟悉. Go的很多语言特性借鉴与它的三个祖先:C,Pascal和CSP.Go的语法.数据类型.控制流等继承于C,Go的包.面对对象等思想来源于Pascal分支,而Go最大的语言特色,基于管道通信的协程并发模型,则借鉴于CSP分支. Go/Python/Erlang语言特性对比 如<编程语言与范式>一文所说,不管语言如何层出不穷

Python Selenium 文件上传(一)

昨天写了Web 文件下载的ui自动化,下载之后,今天就要写web 文件上传的功能了. 当然从折腾了俩小时才上传成功.下面写一下自己操作的步骤 首先网上说的有很多方法 如 input 标签的最好做了,直接定位到元素,然后再sendKeys("value")即可 <input id="file_name" class="text-1 w255" type="text" readonly="" value=

用python操作文件和文件夹

我有一堆层级3到4级的文件夹,这里面存有的一些文件是我需要的,一些是我不需要的.需要的文件都存储在名字中有'Data'的文件夹内.现在我需要把这些文件提取(拷贝)到一个指定的文件夹里. 一个文件夹一个文件夹去点开是一种方法,但是对于层级比较深的文件夹是一件很枯燥的事情. 本着一切尽量自动化的原则,我用python来做这件事情. 这个需求归纳下来需要: 从一个起始目录开始 遍历每一个文件夹 如果文件夹的名字中有'Data',拷贝它的内容至目标文件夹 python对文件.文件夹的操作是非常常见的需求