python3中zipfile模块的常用方法

一、zipfile模块的简述

  zipfile是python里用来做zip格式编码的压缩和解压缩的,由于是很常见的zip格式,所以这个模块使用频率也是比较高的,

在这里对zipfile的使用方法做一些记录。即方便自己也方便别人。

zipfile里有两个非常常用的class, 分别是ZipFile和ZipInfo, 在绝大多数的情况下,我们只需要使用这两个class就可以了。

ZipFile是主要的类,用来创建和读取zip文件而ZipInfo是存储的zip文件的每个文件的信息的。

下面我们就来介绍这两个类的基本操作:

二、ZipFile和Zipinfo这两个类的基本操作

1、class zipfile.ZipFile(file[, mode[, compression[, allowZip64]]])

  创建一个ZipFile对象,表示一个zip文件。参数file表示文件的路径或类文件对象(file-like object);参数mode指示打开zip文件的模式,

默认值为‘r‘,表示读已经存在的zip文件,也可以为‘w‘或‘a‘,‘w‘表示新建一个zip文档或覆盖一个已经存在的zip文档,

import zipfile
f = zipfile.ZipFile(filename, ‘r‘) # 这里的第二个参数用r表示是读取zip文件,w或a是创建一个zip文件

for f_name in f.namelist(): #z.namelist() 会返回压缩包内所有文件名的列表。
    print(f_name)
#上面的代码是读取一个zip压缩包里所有文件的名字。

参数mode的三种模式实例

‘a‘表示将数据附加到一个现存的zip文档中。参数compression表示在写zip文档时使用的压缩方法,它的值可以是zipfile. ZIP_STORED 或zipfile. ZIP_DEFLATED。如果要操作的zip文件大小超过2G,应该将allowZip64设置为True。

  ZipFile还提供了如下常用的方法和属性:

ZipFile.getinfo(name)

  获取zip文档内指定文件的信息。返回一个zipfile.ZipInfo对象,它包括文件的详细信息。

ZipFile.infolist()

  获取zip文档内所有文件的信息,返回一个zipfile.ZipInfo的列表。

ZipFile.namelist()

  获取zip文档内所有文件的名称列表。

ZipFile.extract(member[, path[, pwd]])

  将zip文档内的指定文件解压到当前目录。参数member指定要解压的文件名称或对应的ZipInfo对象;参数path指定了解析文件保存的文件夹;

参数pwd为解压密码。下面一个例子将保存在程序根目录下的duoduo.zip内的所有文件解压到D:/Work目录:

import zipfile, os
f = zipfile.ZipFile(os.path.join(os.getcwd(), ‘duoduo.zip‘))  #拼接成一个路径
for file in f.namelist():
  f.extract(file, r‘d:/Work‘)     #在d:/Work中解压文件
f.close()

上面是os.getcwd的用法!!

ZipFile.extractall([path[, members[, pwd]]])

  解压zip文档中的所有文件到当前目录。参数members的默认值为zip文档内的所有文件名称列表,也可以自己设置,选择要解压的文件名称。

ZipFile.printdir()

  将zip文档内的信息打印到控制台上。

ZipFile.setpassword(pwd)

  设置zip文档的密码。

ZipFile.read(name[, pwd])

  获取zip文档内指定文件的二进制数据。下面的例子演示了read()的使用,zip文档内包括一个duoduo.txt的文本文件,使用read()方法读取其二进制数据,然后保存到D:/duoduo.txt。

import zipfile, os
zipFile = zipfile.ZipFile(os.path.join(os.getcwd(), ‘duoduo.zip‘))
data = zipFile.read(‘duoduo.txt‘)
# (lambda f, d: (f.write(d), f.close()))(open(r‘d:/duoduo.txt‘, ‘wb‘), data)  #一行语句就完成了写文件操作。仔细琢磨哦~_~
with open(r‘d:/duoduo.txt‘,‘wb‘) as f:
    for d in data:
        f.write(d)
zipFile.close()

ZipFile.write(filename[, arcname[, compress_type]])

  将指定文件添加到zip文档中。filename为文件路径,arcname为添加到zip文档之后保存的名称, 参数compress_type表示压缩方法,它的值可以是zipfile. ZIP_STORED 或zipfile. ZIP_DEFLATED。下面的例子演示了如何创建一个zip文档,并将文件D:/test.doc添加到压缩文档中。

import zipfile, os
zipFile = zipfile.ZipFile(r‘D:/test.zip‘), ‘w‘)
zipFile.write(r‘D:/test.doc‘, ‘保存的名字‘, zipfile.ZIP_DEFLATED)
zipFile.close()

ZipFile.writestr(zinfo_or_arcname, bytes)

  writestr()支持将二进制数据直接写入到压缩文档。

2、Class ZipInfo

ZipFile.getinfo(name) 方法返回的是一个ZipInfo对象,表示zip文档中相应文件的信息。它支持如下属性:

ZipInfo.filename:              获取文件名称。
ZipInfo.date_time:            获取文件最后修改时间。返回一个包含6个元素的元组:(年, 月, 日, 时, 分, 秒)
ZipInfo.compress_type:    压缩类型。
ZipInfo.comment:             文档说明。
ZipInfo.extr:                     扩展项数据。
ZipInfo.create_system:     获取创建该zip文档的系统。
ZipInfo.create_version:    获取 创建zip文档的PKZIP版本。
ZipInfo.extract_version:   获取 解压zip文档所需的PKZIP版本。
ZipInfo.reserved:             预留字段,当前实现总是返回0。
ZipInfo.flag_bits:             zip标志位。
ZipInfo.volume:               文件头的卷标。
ZipInfo.internal_attr:       内部属性。
ZipInfo.external_attr:      外部属性。
ZipInfo.header_offset:    文件头偏移位。
ZipInfo.CRC:                   未压缩文件的CRC-32。
ZipInfo.compress_size:   获取压缩后的大小。
ZipInfo.file_size:             获取未压缩的文件大小。

下面一个简单的例子说明这些属性的意思:

import zipfile, os
zipFile = zipfile.ZipFile(os.path.join(os.getcwd(), ‘duoduo.zip‘))
zipInfo = zipFile.getinfo(‘文件中的文件.txt‘)
print (‘filename:‘, zipInfo.filename)  #获取文件名称
print (‘date_time:‘, zipInfo.date_time)   #获取文件最后修改时间。返回一个包含6个元素的元组:(年, 月, 日, 时, 分, 秒)
print (‘compress_type:‘, zipInfo.compress_type) #压缩类型
print (‘comment:‘, zipInfo.comment)   #文档说明
print (‘extra:‘, zipInfo.extra)    #扩展项数据
print (‘create_system:‘, zipInfo.create_system) #获取创建该zip文档的系统。
print (‘create_version:‘, zipInfo.create_version) #获取 创建zip文档的PKZIP版本。
print (‘extract_version:‘, zipInfo.extract_version) #获取 解压zip文档所需的PKZIP版本。
print (‘extract_version:‘, zipInfo.reserved) # 预留字段,当前实现总是返回0。
print (‘flag_bits:‘, zipInfo.flag_bits) #zip标志位。
print (‘volume:‘, zipInfo.volume) # 文件头的卷标。
print (‘internal_attr:‘, zipInfo.internal_attr) #内部属性。
print (‘external_attr:‘, zipInfo.external_attr) #外部属性。
print (‘header_offset:‘, zipInfo.header_offset) # 文件头偏移位。
print (‘CRC:‘, zipInfo.CRC) # 未压缩文件的CRC-32。
print (‘compress_size:‘, zipInfo.compress_size) #获取压缩后的大小。
print (‘file_size:‘, zipInfo.file_size) #获取未压缩的文件大小。
zipFile.close() #

原文地址:https://www.cnblogs.com/ManyQian/p/9193199.html

时间: 2024-11-07 13:00:46

python3中zipfile模块的常用方法的相关文章

Python3中正则模块re.compile、re.match及re.search

本文实例讲述了Python3中正则模块re.compile.re.match及re.search函数用法.分享给大家供大家参考,具体如下: re模块 re.compile.re.match. re.search re 模块官方说明文档 正则匹配的时候,第一个字符是 r,表示 raw string 原生字符,意在声明字符串中间的特殊字符不用转义. 比如表示 '\n',可以写 r'\n',或者不适用原生字符 '\n'. 推荐使用 re.match re.compile() 函数 编译正则表达式模式,

Python3中正则模块re.compile、re.match及re.search函数用法详解

Python3中正则模块re.compile.re.match及re.search函数用法 re模块 re.compile.re.match. re.search 正则匹配的时候,第一个字符是 r,表示 raw string 原生字符,意在声明字符串中间的特殊字符不用转义. 比如表示 ‘\n',可以写 r'\n',或者不适用原生字符 ‘\n'. 推荐使用 re.match re.compile() 函数 编译正则表达式模式,返回一个对象.可以把常用的正则表达式编译成正则表达式对象,方便后续调用及

Python3中的模块

模块使用哪种语言实现并不重要,因为所有的模块导入与使用的方式都相同. 1.常用模块导入格式: import importable1,importable2,... import importable as preferred_name #将导入的模块自定义名称.如果模块是一个包或包中的一个模块,则需将每一部分用"."进行分隔. from importable import * #将包内的所有内容都导入 from importable import object1,object2,...

Python3 中 random模块

Python中的random模块用于生成随机数. 下面具体介绍random模块的功能: 1.random.random() #用于生成一个0到1的 随机浮点数:0<= n < 1.0 import random a = random.random() print (a) 2.random.uniform(a,b) #用于生成一个指定范围内的随机符点数,两个参数其中一个是上限,一个是下限.如果a > b,则生成的随机数n: a <= n <= b.如果 a <b, 则 b

python3中argparse模块

1.定义:argparse是python标准库里面用来处理命令行参数的库 2.命令行参数分为位置参数和选项参数: 位置参数就是程序根据该参数出现的位置来确定的 如:[[email protected]_1 /]# ls root/    #其中root/是位置参数 选项参数是应用程序已经提前定义好的参数,不是随意指定的 如:[[email protected]_1 /]# ls -l    # -l 就是ls命令里的一个选项参数 3.使用步骤: (1)import argparse    首先导

python3中SYS模块

sys.argv               命令行参数List,第一个元素是程序本身路径sys.modules        返回系统导入的模块字段,key是模块名,value是模块sys.exit(n)           退出程序,正常退出时exit(0)sys.version          获取Python解释程序的版本信息sys.maxint           最大的Int值sys.path             返回模块的搜索路径,初始化时使用PYTHONPATH环境变量的值

python之模块配置文件ConfigParser(在python3中变化较大)

# -*- coding: utf-8 -*- #python 27 #xiaodeng #python之模块ConfigParser(在python3中为configparser) #特别注意:python3和python2关于该模块的功能用法有很大的不同. #配置文件解析器 import ConfigParser,os #初始化一个配置文件对象 config=ConfigParser.ConfigParser() #增加一个section config.add_section('Sectio

python3 中引用 HTMLTestRunner.py 模块的注意事项

HTMLTestRunner.py支持python2中运行,如果在python3.6.2中引用HTMLTestRunner.py模块,需要做一下更改: 1.更改HTMLTestRunner.py模块中的代码 1.更改StringIO模块导入方式:  2.self.outputBuffer=StringIO.StringIO()  改为self.outputBuffer= StringIO() 3.python3.6.2字典无has_key方法: 4.str没有decode方法,去掉decode转

把模块有关联的放在一个文件夹中 在python2中调用文件夹名会直接失败 在python3中调用会成功,但是调用不能成功的解决方案

把模块有关联的放在一个文件夹中 在python2中调用文件夹名会直接失败在python3中调用会成功,但是调用不能成功 解决办法是: 在该文件夹下加入空文件__init__.py python2会把该文件夹整体当成一个包 然后编辑__init__.py 加入__all__ = ["功能名1","功能名2",...../或者类名也行] 再通过from . import 模块名 这样就可以调用包中那些模块功能了 #如果导入这个模块的方式是 from 模块名 import