Python操作Zip文件

Python操作Zip文件

需要使用到zipfile模块

读取Zip文件

随便一个zip文件,我这里用了bb.zip,就是一个文件夹bb,里面有个文件aa.txt。

import zipfile

# 默认模式r,读
azip = zipfile.ZipFile(‘bb.zip‘)  # [‘bb/‘, ‘bb/aa.txt‘]
# 返回所有文件夹和文件
print(azip.namelist())
# # 返回该zip的文件名
print(azip.filename)

# 压缩文件里bb文件夹下的aa.txt
azip_info = azip.getinfo(‘bb/aa.txt‘)
# 原来文件大小
print(azip_info.file_size)
# 压缩后大小
print(azip_info.compress_size)

# 这样可以求得压缩率,保留小数点后两位
print(‘压缩率为{:.2f}‘.format(azip_info.file_size/azip_info.compress_size))

可以看到打开方式并不是想象中的open,而是ZipFile。用namelist()可以返回里面所有的文件夹和文件路径。getinfo可以获得某路径下文件的信息,如上。

还能直接读取压缩包里文件的内容,下面两种方法得到的结果是一样的。需要注意的是,读取出来的数据好像是字节形式的,解码成utf-8就好

# 可以直接读取里面的内容, 不过貌似是字节形式.需要解码回utf-8.参数也可以传ZiInfo, 如b
a = azip.read(‘bb/cc.txt‘).decode(‘utf-8‘)
print(a)
# 打开文件再读取,好像比上面麻烦
b = azip.open(azip_info)
print(b.read().decode(‘utf-8‘))
azip.close()

用完资源后记得主动close。

解压Zip

最为关键的功能,一句搞定。默认解压在当前工作目录,可以指定解压目录。

azip.extractall()

新建Zip文件

不仅能读还能写。新建压缩包的时候,可以选择压缩算法,比如DEFLATED和LZMA

# 新建压缩包,放文件进去,若压缩包已经存在,将覆盖。可选择用a模式,追加
azip = zipfile.ZipFile(‘bb.zip‘, ‘w‘)
# 必须保证路径存在,将bb件夹(及其下aa.txt)添加到压缩包,压缩算法LZMA
azip.write(‘D:/bb/aa.txt‘, compress_type=zipfile.ZIP_LZMA)
# 写入一个新文件到压缩包中,data是该文件的具体内容,可以是str或者是byte。
# 这里是新建一个bb文件夹,其下再新建一个cc.txt,将hello world写入到文本中
azip.writestr(‘bb/cc.txt‘, data=‘Hello World‘, compress_type=zipfile.ZIP_DEFLATED)
# 关闭资源
azip.close()

上面有两个方法比较类似,注意区分。

  • write指的是将已经存在的文件复制到压缩包,包括路径中的所有文件夹河其下的文件。
  • writestr是直接在压缩包里新建文件夹和文件,data参数是往该文件中写入的内容。

最终压缩包里会被添加bb文件夹,其下有aa.txtcc.txt

将整个文件夹添加到压缩包中

如果我们这样写,想象着能添加bb文件夹下所有内容到压缩包中,那就不对了。这样添加,只会把bb文件夹复制过去,也仅仅如此,里面的文件不会添加到压缩包。最后得到的只是一个空文件夹。

azip.write(r‘D:/bb‘, compress_type=zipfile.ZIP_LZMA)

那怎么办呢?只好递归查找添加了,os.walk刚好可以帮助我们。

for current_path, subfolders, filesname in os.walk(r‘D:\bb‘):
    print(current_path, subfolders, filesname)
    #  filesname是一个列表,我们需要里面的每个文件名和当前路径组合
    for file in filesname:
        # 将当前路径与当前路径下的文件名组合,就是当前文件的绝对路径
        azip.write(os.path.join(current_path, file))
# 关闭资源
azip.close()

正确选用变量,元组中第一个是当前路径,而第三个是当前路径下的文件,两者一组合刚好就是文件的绝对路径。

这样就可以实现添加整个文件夹添加到压缩包了。而且是这些路径下所有的文件夹和其下的文件全部添加。也就是说,保留了原文件夹的结构层次。

shutil添加压缩包和解压缩

shuitl模块有个函数,可以方便地添加整个整个文件夹到压缩包。

# 第一个参数是归档文件名称,第二个参数是指定的格式,不仅是支持zip,第三个参数是要压缩文件/文件夹的路径
shutil.make_archive(‘archive_name‘, ‘zip‘, r‘F:\IDE Setting‘)
# shutil.get_archive_formats() 可以查看支持的格式

当然也可以解压缩,可指定解压目录,否则默认解压到当前工作目录

shutil.unpack_archive(r‘D:\bb.zip‘)

# shutil.get_unpack_formats() 可以查看支持的格式

原文地址:https://www.cnblogs.com/a-dyw/p/9368649.html

时间: 2024-10-27 07:53:58

Python操作Zip文件的相关文章

python操作txt文件中数据教程[1]-使用python读写txt文件

python操作txt文件中数据教程[1]-使用python读写txt文件 觉得有用的话,欢迎一起讨论相互学习~Follow Me 原始txt文件 程序实现后结果 程序实现 filename = './test/test.txt' contents = [] DNA_sequence = [] # 打开文本并将所有内容存入contents中 with open(filename, 'r') as f: for line in f.readlines(): contents.append(line

使用commons-compress操作zip文件(压缩和解压缩)

http://www.cnblogs.com/luxh/archive/2012/06/28/2568758.html Apache Commons Compress是一个压缩.解压缩文件的类库. 可以操作ar, cpio, Unix dump, tar, zip, gzip, XZ, Pack200 and bzip2格式的文件,功能比较强大. 在这里写两个用Commons Compress把文件压缩成zip和从zip解压缩的方法. 直接贴上工具类代码: /** * Zip文件工具类 * @a

python 操作Excel文件

1   安装xlrd.xlwt.xlutils cmd下输入: pip install xlrd        #读取excel pip install xlwt        #写入excel pip install xlutils      #操作 Excel 文件的实用工具,如复制.分割.筛选等 2   模块的基本用法: xlrd模块用于读取excel文件内容,xlwt用于写入数据,xlutils复制 2.1  打开excel文件 myworkbook = xlrd.open_workbo

Python操作csv文件

一.Python读取csv文件 1 说明:以Python3.x为例 2 #读取csv文件方法1 3 import csv 4 csvfile = open('csvWrite.csv',newline='')#打开一个文件 5 csvReader = csv.reader(csvfile)#返回的可迭代类型 6 print(type(csvReader)) 7 for content in csvReader: 8 print(content) 9 csvfile.close()#关闭文件运行结

python操作json文件获取内容

写case时,将case 写到json文件比写到,写python一定要学会处理json 以下,是要处理的json 处理操作包括:打开json文件,获取json文件内容,关闭json文件,读取内容中的对应key的value { "name": "BeJson", "url": "http://www.bejson.com", "page": 88, "isNonProfit": true,

python 操作 excel文件

一.安装xlrd模块 到python官网下载http://pypi.python.org/pypi/xlrd模块安装,前提是已经安装了python 环境. 二.使用介绍 1.导入模块 import xlrd 2.打开Excel文件读取数据 data = xlrd.open_workbook('excelFile.xls') 3.使用技巧 获取一个工作表 table = data.sheets()[0]          #通过索引顺序获取 table = data.sheet_by_index(

用python操作PDF文件

本次学习的内容主要是:从PDF读取文本内容和从已经有的文档生成新的PDF. 需要用到的模块是PyPDF2. 首先要在命令行中运行pip install PyPDF2. 一.从PDF读取文本 PyPDF2无法从pdf文档中提取图像,图表和其他媒体,但是它可以提取文本,并且将文本返回为python字符串.import PyPDF2# ===============从pdf中提取文本===========pdffile = open(r'E:\python让繁琐的工作自动化\13_处理pdf和word

python 操作execl文件

http://www.jb51.net/article/60510.htm import xlrdimport xlwt # 打开文件   workbook = xlrd.open_workbook(r'F:\demo.xlsx')

python将zip文件解压到指定目录

import shutil file_obj = request.files.get('code') # form表单提交的文件对象 target_path = os.path.join('uploadfiles', str(uuid.uuid4())) # 为了防止覆盖相同文件,在上传目录下随机生成一个目录shutil._unpack_zipfile(file_obj, target_path) # 获取form表单提交的文件对象后,直接解压到指定目录 原文地址:https://www.cnb