Python3快速入门(十八)——PyInstaller打包发布

Python3快速入门(十八)——PyInstaller打包发布

一、PyInstaller简介

1、PyInstaller简介

PyInstaller是一个跨平台的Python应用打包工具,支持 Windows/Linux/MacOS三大主流平台,能够把 Python 脚本及其所在的 Python 解释器打包成可执行文件,从而允许最终用户在无需安装 Python 的情况下执行应用程序。
PyInstaller 制作出来的执行文件并不是跨平台的,如果需要为不同平台打包,就要在相应平台上运行PyInstaller进行打包。

2、PyInstaller安装

pip install PyInstaller

二、PyInstaller基础用法

1、PyInstaller使用

pyinstaller main.py
PyInstaller 最简单使用只需要指定作为程序入口的脚本文件。PyInstaller 执行打包程序后会在当前目录下创建下列文件和目录:
main.spec 文件,其前缀和脚本名相同,指定了打包时所需的各种参数;
build 子目录,其中存放打包过程中生成的临时文件。warnxxxx.txt文件记录了生成过程中的警告/错误信息。如果 PyInstaller 运行有问题,需要检查warnxxxx.txt文件来获取错误的详细内容。xref-xxxx.html文件输出 PyInstaller 分析脚本得到的模块依赖关系图。
dist子目录,存放生成的最终文件。如果使用单文件模式将只有单个执行文件;如果使用目录模式的话,会有一个和脚本同名的子目录,其内才是真正的可执行文件以及附属文件。

2、PyInstaller命令行选项

PyInstaller命令行选项可以通过帮助信息查看:
pyinstaller --help
-y | --noconfirm:直接覆盖输出文件,而无需提示,在多次重复运行命令时可避免反复确认。
-D | --onedir:生成包含执行文件的目录(默认行为)。
-F | --onefile:生成单一的可执行文件,不推荐使用。
-i | --icon [.ico | .exe | .icns]:为 Windows/Mac 平台的执行文件指定图标。
--version-file [filename]:添加文件版本信息。
-c | --console | --nowindowed:通过控制台窗口运行程序 并且分配标准输入/输出,(默认行为)。
-w | --windowed | --noconsole:不创建控制台窗口,也不分配标准输入/输出,主要用来运行 GUI 程序。没有输入输出会给调试带来一定困难,因此即便是 GUI 程序,建议在调试时禁用本选项,在最终发布时再打开。
--add-data [file:dir]:添加数据文件。如果有多个文件需要添加,本选项可以出现多次。参数的格式为文件名+输出目录名,用路径分隔符分割,在 Windows 下使用?;,其它系统下则使用?:。 如果输出到和脚本相同的目录,则使用?.?作为输出目录。
--add-binary [file:dir]:添加二进制文件,即运行程序所需的.exe/.dll/.so 等。

3、单目录模式

单目录模式是 PyInstaller 将 Python 程序编译为同一个目录下的多个文件,其中 xxxx.exe 是程序入口点(xxxx 是脚本文件名称,可以通过命令行修改)。单目录模式是 PyInstaller 的默认模式,可以自己加上?-D?或者?--onedir?开关显式开启。
单目录模式打包生成的目录除可执行文件外,还包括 Python 解释器(PythonXX.dll)、系统运行库(ucrtbase.dll 以及其它 apixx.dll),以及一些编译后的 Python 模块(.pyd 文件)。

4、单文件模式

单文件模式是将整个程序编译为单一的可执行文件。需要在命令行添加?-F?或者?--onefile?开关开启。
Python脚本是解释型程序,而不是 原生的编译程序,并不能产生出真正单一的可执行文件。如果使用单文件模式,PyInstaller打包生成的是自动解压程序,需要先把所有文件解压到一个临时目录(通常名为_MEIxxxx,xxxx是随机数字),再从临时目录加载解释器和附属文件。程序运行完毕后,如果一切正常,会将临时目录再删除。
PyInstaller会对运行时的Python解释器修改。如果直接运行 Python 脚本,那么sys.frozen?变量不存在,如果通过 PyInstaller 生成的可执行文件运行,PyInstaller 会设置sys.frozen?变量为 True;如果使用单文件模式,sys._MEIPASS?变量包含了PyInstaller 自动创建的临时目录名。
单文件模式因为有临时目录和解压文件过程,所以程序启动速度会比较慢。如果程序运行到一半崩溃,则临时目录将没有机会被删除。

三、PyInstaller规格文件

PyInstaller 在生成文件的同时会创建一个相应的.spec 文件,.spec 文件本质上是一个特殊的 Python 脚本,记录了生成所需的指令。

1、Spec文件生成

使用pyinstaller [options] xxx.py进行打包时,PyInstaller 会首先根据选项生成对应的 .spec 文件,然后执行 .spec 文件所指定的过程生成最终文件。因此,可以直接指定spec文件执行打包过程。
pyinstaller [options] xxx.spec

2、Spec文件格式

单目录模式生成的spec 文件格式如下:

a = Analysis(...)
pyz = PYZ(...)
exe = EXE(...)
coll = COLLECT(...)

单文件模式生成的spec 文件格式如下:

a = Analysis(...)
pyz = PYZ(...)
exe = EXE(...)

单文件模式是将所有内容统一打包到 .exe,而单目录模式除了生成 .exe 外,还需要拷贝其它附属文件。
Analysis用于分析脚本的引用关系,并将所有查找到的相关内容记录在内部结构中,供后续步骤使用;
PYZ将所有 Python 脚本模块编译为对应的 .pyd 并打包;
EXE:将打包后的 Python 模块及其它文件一起生成可执行的文件结构;
COLLECT:将引用到的附属文件拷贝到生成目录的对应位置。
如果数据文件很多导致 Analysis 太长,则可以提取为单独的变量。

data_files = [(...)]
a = Analysis(...,
             datas=data_files,
             ...)

可以为数据/二进制文件指定通配符,从而匹配同一类型的多个文件。

a = Analysis(...,
             datas=[(‘media/*.mp3‘, ‘media‘)],
             ...)

可以将指定文件和指定目录打包进行打包,如下:

a = Analysis(...,
             datas=[(‘config.ini‘, ‘.‘), (‘data‘, ‘data‘)],
             ...)

将config.ini文件打包当可执行文件当前目录下,将data目录打包到可执行文件当前目录下。

四、PyInstaller Hook机制

1、PyInstaller Hook简介

PyInstaller 使用递归方法,从入口的脚本文件逐个分析,获取依赖模块。
PyInstaller 能识别 ctypes、SWIG、Cython 等形式的模块调用,但文件名必须为字面值。但PyInstaller 无法识别动态和调用,例如?import、exec、eval,以及以变量为参数的调用。
当 PyInstaller 识别完所有模块后,会在内部构成一个树形结构表示调用关系图,调用关系在生成目标时也会一并输出(xref-xxxx.html 文件)。PYZ 步骤会将所有识别到的模块汇集起来,如果有必要会编译成.pyd,然后将文件打包。但仍然存在以下问题:
(1)由于动态模块调用未必可以自动识别到,因此不会打包到文件中,执行时肯定会出现问。
(2)有些模块并非是以模块的形式,而是通过文件系统去访问 .py 文件,代码在运行时同样会出现问题。
为了解决上述问题,PyInstaller引入了Hooks机制,对于两种问题引入了两种类型的 Hook。两种 Hook 主要是按照加载时间区分,第一种Hook在 PyInstaller 文档中没有明确的命名,是在生成过程中,导入特定模块时调用的,称为 Import Hook;第二种是Runtime Hook,是在执行文件启动期间、加载特定模块时调用的。

2、Import Hooks

PyInstaller 定义的所有 Hook 在 PyInstaller 安装目录的 hooks 子目录下,文件的命名均为 hook-[模块名].py 的形式,即为 Import Hook。
当 PyInstaller 生成过程中找到特定的导入模块,就会到hooks目录下查找是否存在对应的Hook,如果存在,则执行之。
hook-PyQt5.py文件如下:

import os

from PyInstaller.utils.hooks import collect_system_data_files
from PyInstaller.utils.hooks.qt import pyqt5_library_info, get_qt_binaries

# Ensure PyQt5 is importable before adding info depending on it.
if pyqt5_library_info.version:
    hiddenimports = [
        # PyQt5.10 and earlier uses sip in an separate package;
        ‘sip‘,
        # PyQt5.11 and later provides SIP in a private package. Support both.
        ‘PyQt5.sip‘
    ]

    # Collect the ``qt.conf`` file.
    datas = [x for x in
             collect_system_data_files(pyqt5_library_info.location[‘PrefixPath‘],
                                       ‘PyQt5‘)
             if os.path.basename(x[0]) == ‘qt.conf‘]

    # Collect required Qt binaries.
    binaries = get_qt_binaries(pyqt5_library_info)

hiddenimports是PyInstaller 用来描述并非通过 import 明确导入,而是通过其它动态机制加载的模块。

3、Runtime Hooks

Runtime Hooks均位于 PyInstaller 安装目录下的loader\rthooks 子目录下,并且命名方式是 pyi_rth_[模块名称].py(rth 代表 run time hook)。
loader\rthooks.dat内容是一个字典,记录了系统中所有支持的 Runtime Hooks。rthooks.dat文件如下:

{
    ‘certifi‘:    [‘pyi_rth_certifi.py‘],
    ‘django‘:     [‘pyi_rth_django.py‘],
    ‘enchant‘:    [‘pyi_rth_enchant.py‘],
    ‘gi‘:         [‘pyi_rth_gi.py‘],
    ‘gi.repository.Gio‘:    [‘pyi_rth_gio.py‘],
    ‘gi.repository.GLib‘:   [‘pyi_rth_glib.py‘],
    ‘gi.repository.GdkPixbuf‘:    [‘pyi_rth_gdkpixbuf.py‘],
    ‘gi.repository.Gtk‘:    [‘pyi_rth_gtk.py‘],
    ‘gi.repository.Gst‘:    [‘pyi_rth_gstreamer.py‘],
    ‘gst‘:        [‘pyi_rth_gstreamer.py‘],
    ‘kivy‘:       [‘pyi_rth_kivy.py‘],
    ‘kivy.lib.gstplayer‘: [‘pyi_rth_gstreamer.py‘],
    ‘matplotlib‘: [‘pyi_rth_mplconfig.py‘, ‘pyi_rth_mpldata.py‘],
    ‘osgeo‘:      [‘pyi_rth_osgeo.py‘],
    ‘pkg_resources‘:  [‘pyi_rth_pkgres.py‘],
    ‘PyQt4‘:      [‘pyi_rth_qt4plugins.py‘],
    ‘PyQt5‘:      [‘pyi_rth_pyqt5.py‘],
    ‘PyQt5.QtWebEngineWidgets‘: [‘pyi_rth_pyqt5webengine.py‘],
    ‘PySide‘:      [‘pyi_rth_qt4plugins.py‘],
    ‘PySide2‘:      [‘pyi_rth_pyside2.py‘],
    ‘PySide2.QtWebEngineWidgets‘: [‘pyi_rth_pyside2webengine.py‘],
    ‘_tkinter‘:    [‘pyi_rth__tkinter.py‘],
    ‘traitlets‘:  [‘pyi_rth_traitlets.py‘],
    ‘twisted.internet.reactor‘:        [‘pyi_rth_twisted.py‘],
    ‘usb‘:        [‘pyi_rth_usb.py‘],
    ‘win32com‘:   [‘pyi_rth_win32comgenpy.py‘],
    ‘multiprocessing‘: [‘pyi_rth_multiprocessing.py‘],
    ‘nltk‘: [‘pyi_rth_nltk.py‘],
}

Runtime Hooks 是在执行文件运行期间执行的。PyInstaller 修改了模块加载机制,当运行期间加载任何模块时,PyInstaller 会检查是否有对应的 Runtime Hook,如果有,则运行相应Hook。因此,Runtime Hooks 是和脚本一起编译到可执行文件中的。
pyi_rth_pyqt5.py文件如下:

import os
import sys

# The path to Qt‘s components may not default to the wheel layout for
# self-compiled PyQt5 installations. Mandate the wheel layout. See
# ``utils/hooks/qt.py`` for more details.
pyqt_path = os.path.join(sys._MEIPASS, ‘PyQt5‘, ‘Qt‘)
os.environ[‘QT_PLUGIN_PATH‘] = os.path.join(pyqt_path, ‘plugins‘)
os.environ[‘QML2_IMPORT_PATH‘] = os.path.join(pyqt_path, ‘qml‘)

五、错误调试

使用PyInstaller进行打包时,最常见的错误是Failed to execute script xxx,通常做法是先使用pyinstaller -c xxx.py将应用打包为控制台应用,在命令行执行相应可执行程序查看错误输出,进而逐个排除错误。

原文地址:https://blog.51cto.com/9291927/2436527

时间: 2024-10-08 15:42:42

Python3快速入门(十八)——PyInstaller打包发布的相关文章

Python3快速入门(八)——Python3 JSON

Python3快速入门(八)--Python3 JSON 1.JSON简介 JSON (JavaScript Object Notation) 是一种轻量级的数据交换格式,是基于ECMAScript的一个子集. 2.json模块简介 Python3 中可以使用 json 模块来对 JSON 数据进行编解码,包含两个函数:json.dumps():?对数据进行编码.json.loads():?对数据进行解码.在json的编解码过程中,Python 的数据类型与json类型会相互转换.json.du

Python3快速入门(八)Python3 JSON

1.JSON简介 JSON (JavaScript Object Notation) 是一种轻量级的数据交换格式,是基于ECMAScript的一个子集. 2.json模块简介 Python3 中可以使用 json 模块来对 JSON 数据进行编解码,包含两个函数: json.dumps(): 对数据进行编码. json.loads(): 对数据进行解码. 在json的编解码过程中,Python 的数据类型与json类型会相互转换. json.dump():将数据保存为JSON文件 json.lo

Python3快速入门

Python3快速入门Python3快速入门(一)--Python简介https://blog.51cto.com/9291927/2385592Python3快速入门(二)--Python3基础https://blog.51cto.com/9291927/2409575Python3快速入门(三)--Python3标准数据类型https://blog.51cto.com/9291927/2409580Python3快速入门(四)--Python包管理https://blog.51cto.com

Python3快速入门(十)——Python3网络编程

Python3快速入门(十)--Python3网络编程 一.socket模块简介 Python 提供了两个级别访问的网络服务,低级别的网络服务支持基本的 Socket,提供了标准的BSD Sockets API,可以访问底层操作系统Socket接口的全部方法:高级别的网络服务模块 SocketServer, 提供了服务器中心类,可以简化网络服务器的开发.socket不支持多并发,socketserver是对socket的再封装,简化网络服务器版的开发. 二.socket模块接口 1.socket

Python3快速入门(十二)——NumPy

Python3快速入门(十二)--NumPy 一.NumPy简介 1.NumPy简介 NumPy(Numerical Python) 是 Python 语言的一个扩展程序库,支持大量的维度数组与矩阵运算,同时对数组运算提供了大量的数学函数库.Numpy 是一个运行速度非常快的数学库,内部解除了CPython的GIL(全局解释器锁),运行效率极好,主要用于数组计算,是大量机器学习框架的基础库,NumPy主要包括如下:(1)强大的N维数组对象 ndarray(2)广播功能函数(3)整合 C/C++/

Python3快速入门(十五)——Pandas数据处理

Python3快速入门(十五)--Pandas数据处理 一.函数应用 1.函数应用简介 如果要将自定义函数或其它库函数应用于Pandas对象,有三种使用方式.pipe()将函数用于表格,apply()将函数用于行或列,applymap()将函数用于元素. 2.表格函数应用 可以通过将函数对象和参数作为pipe函数的参数来执行自定义操作,会对整个DataFrame执行操作. # -*- coding=utf-8 -*- import pandas as pd import numpy as np

Python3快速入门(十六)——Matplotlib绘图

Python3快速入门(十六)--Matplotlib绘图 一.Matplotlib简介 1.Matplotlib简介 Matplotlib是 Python 2D-绘图领域使用最广泛的套件,可以简易地将数据图形化,并且提供多样化的输出格式.matplotlib有两个接口,一个是状态机层的接口,通过pyplot模块来进行管理:一个是面向对象的接口,通过pylab模块将所有的功能函数全部导入其单独的命名空间内. 2.Matplotlib安装 使用conda安装如下:conda install mat

区块链快速入门(八)——以太坊

区块链快速入门(八)--以太坊 一.以太坊简介 以太坊(Ethereum)项目的最初目标是打造一个运行智能合约的平台(Platform for Smart Contract),支持图灵完备的应用,按照智能合约的约定逻辑自动执行,理想情况下将不存在故障停机.审查.欺诈以及第三方干预等问题.以太坊平台目前支持Golang.C++.Python等多种语言实现的客户端.由于核心实现上基于比特币网络的核心思想进行了拓展,因此在很多设计特性上都与比特币网络十分类似.基于以太坊项目,以太坊团队目前运营了一条公

Python3快速入门(六)——Python3面向对象

Python3快速入门(六)--Python3面向对象 一.面向对象技术简介 1.面向对象简介 面向对象编程(Object Oriented Programing,OOP)是一种编程思想,OOP把对象当成程序的一个基本单元,一个对象包含数据和操作数据的方法.面向对象编程的三大特性如下:A.封装,可以隐藏实现细节,使代码模块化.B.继承,可以通过扩展已存在的类来实现代码重用,避免重复编写相同的代码.C.多态,封装和继承的目的都是为了实现代码重用, 而多态是为了实现接口重用,使得类在继承和派生的时候