(转)Python中的模块循环导入问题

本文转自: https://wiki.woodpecker.org.cn/moin/MiscItems/2008-11-25

问题

cleven <[email protected]>

回覆至     [email protected]
收件人     [email protected]
日期      2008年11月25日 下午 12:01
主旨      [CPyUG:72341] import嵌套的问题

看了《Python源码剖析》,里面提到的嵌套import的问题还是没有弄明白,各位给看一下吧。

[A.py]
from B import D
class C:pass

[B.py]
from A import C
class D:pass

为什么执行A的时候不能加载D呢?

如果将A.py改为:import B就可以了。

这是怎么回事呢?

Robert Chen:详解

Robert Chen <[email protected]m>
回覆至     [email protected]
收件人     [email protected]
日期      2008年11月25日 下午 1:41
主旨      [CPyUG:72362] Re: import嵌套的问题

恩,这跟Python内部import的机制是有关的,具体到from B import D,Python内部会分成几个步骤:

  1. 在sys.modules中查找符号"B"
  2. 如果符号B存在,则获得符号B对应的module对象<module B>
    • 从<module B>的__dict__中获得符号"D"对应的对象,如果"D"不存在,则抛出异常
  3. 如果符号B不存在,则创建一个新的module对象<module B>,注意,这时,module对象的__dict__为空
    • 执行B.py中的表达式,填充<module B>的__dict__
    • 从<module B>的__dict__中获得"D"对应的对象,如果"D"不存在,则抛出异常

所以,这个例子的执行顺序如下:

1、执行A.py中的from B import D
    由于是执行的python A.py,所以在sys.modules中并没有<module B>存在,
    首先为B.py创建一个module对象(<module B>),
      注意,这时创建的这个module对象是空的,里边啥也没有,
    在Python内部创建了这个module对象之后,就会解析执行B.py,其目的是填充<module B>这个dict。

2、执行B.py中的from A import C
    在执行B.py的过程中,会碰到这一句,
    首先检查sys.modules这个module缓存中是否已经存在<module A>了,
    由于这时缓存还没有缓存<module A>,
    所以类似的,Python内部会为A.py创建一个module对象(<module A>),
    然后,同样地,执行A.py中的语句

3、再次执行A.py中的from B import D
    这时,由于在第1步时,创建的<module B>对象已经缓存在了sys.modules中,
    所以直接就得到了<module B>,
    但是,注意,从整个过程来看,我们知道,这时<module B>还是一个空的对象,里面啥也没有,
    所以从这个module中获得符号"D"的操作就会抛出异常。
    如果这里只是import B,由于"B"这个符号在sys.modules中已经存在,所以是不会抛出异常的。

ZQ:图解

编译追踪

hiter的日记:

问题代码如下:

A.py
from A import B
class B(object):pass
>>> import A
Traceback (most recent call last):
  File "<stdin>", line 1, in <module>
  File "/home/john/pythonstudy/mypython/bin/A.py", line 9, in <module>
    from A import B
ImportError: cannot import name B
>>>

阅读代码后发现: 字节码大概

9           0 LOAD_CONST               0 (-1)
              3 LOAD_CONST               1 ((‘B‘,))
              6 IMPORT_NAME              0 (A)
              9 IMPORT_FROM              1 (B)
             12 STORE_NAME               1 (B)
             15 POP_TOP

 10          16 LOAD_CONST               2 (‘B‘)
             19 LOAD_NAME                2 (object)
             22 BUILD_TUPLE              1
             25 LOAD_CONST               3 (<code object B at 0xb7a1fa88, file "A.py", line 10>)
             28 MAKE_FUNCTION            0
             31 CALL_FUNCTION            0
             34 BUILD_CLASS
             35 STORE_NAME               1 (B)

 12          38 LOAD_CONST               4 (‘hi‘)
             41 PRINT_ITEM
             42 PRINT_NEWLINE
             43 LOAD_CONST               5 (None)
             46 RETURN_VALUE
  • 可以看出整个import的过程是:先import A,然后再import A然后报错。
  • 经过分析发现原因是:在import A时,虚拟机发现sys.modules(在import_submodule中会做检查)中没有加载过A,然后新建了一个A的module,新建的module是空的,需要向里面加入__builtin__,__file__等属性(在执行下一个import的时候,新module的dict将作为globals(locals)传给执行(A)字节码时使用),然后虚拟机会将这个新的module加入sys.modules中,至此虚拟机的调用堆栈如下:(代码行号可能不对,因为源码中加入了很多调试输出代码)
#0  PyImport_AddModule (name=0xbfd91673 "A") at Python/import.c:617                                                            <-------PyImport_AddModule 在这里
#1  0x08106271 in PyImport_ExecCodeModuleEx (name=0xbfd91673 "A", co=0xb7da6748, pathname=0xbfd8f533 "A.pyc") at Python/import.c:653
#2  0x08106c67 in load_source_module (name=0xbfd91673 "A", pathname=0xbfd8f533 "A.pyc", fp=0x821bd60) at Python/import.c:963
#3  0x081085cf in load_module (name=0xbfd91673 "A", fp=0x821bd60, buf=0xbfd905d3 "A.py", type=1, loader=0x0) at Python/import.c:1753
#4  0x0810a39b in import_submodule (mod=0x818c888, subname=0xbfd91673 "A", fullname=0xbfd91673 "A") at Python/import.c:2433    <--------import_submodule 在这里
#5  0x081098bb in load_next (mod=0x818c888, altmod=0x818c888, p_name=0xbfd91654, buf=0xbfd91673 "A", p_buflen=0xbfd9166c)
    at Python/import.c:2234
#6  0x08108e1c in import_module_level (name=0x0, globals=0xb7de82b4, locals=0xb7de82b4, fromlist=0x818c888, level=-1) at Python/import.c:2005
#7  0x081093a1 in PyImport_ImportModuleLevel (name=0xb7de115c "A", globals=0xb7de82b4, locals=0xb7de82b4, fromlist=0x818c888, level=-1)
    at Python/import.c:2076
#8  0x080d8809 in builtin___import__ (self=0x0, args=0xb7d9de34, kwds=0x0) at Python/bltinmodule.c:47
#9  0x0814d04b in PyCFunction_Call (func=0xb7dcf5ac, arg=0xb7d9de34, kw=0x0) at Objects/methodobject.c:77
#10 0x08062974 in PyObject_Call (func=0xb7dcf5ac, arg=0xb7d9de34, kw=0x0) at Objects/abstract.c:1861
#11 0x080ecad2 in PyEval_CallObjectWithKeywords (func=0xb7dcf5ac, arg=0xb7d9de34, kw=0x0) at Python/ceval.c:3446
#12 0x080e7b33 in PyEval_EvalFrameEx (f=0x821bc04, throwflag=0) at Python/ceval.c:2068
#13 0x080eaf9e in PyEval_EvalCodeEx (co=0xb7d9ab08, globals=0xb7de82b4, locals=0xb7de82b4, args=0x0, argcount=0, kws=0x0, kwcount=0,
    defs=0x0, defcount=0, closure=0x0) at Python/ceval.c:2840
#14 0x080e013e in PyEval_EvalCode (co=0xb7d9ab08, globals=0xb7de82b4, locals=0xb7de82b4) at Python/ceval.c:494
#15 0x08116ab0 in run_mod (mod=0x8220378, filename=0x81653bb "<stdin>", globals=0xb7de82b4, locals=0xb7de82b4, flags=0xbfd92f70,
    arena=0x81c5cd8) at Python/pythonrun.c:1273
#16 0x081151e1 in PyRun_InteractiveOneFlags (fp=0xb7f4d440, filename=0x81653bb "<stdin>", flags=0xbfd92f70) at Python/pythonrun.c:792
#17 0x08114e54 in PyRun_InteractiveLoopFlags (fp=0xb7f4d440, filename=0x81653bb "<stdin>", flags=0xbfd92f70) at Python/pythonrun.c:723
#18 0x08114cac in PyRun_AnyFileExFlags (fp=0xb7f4d440, filename=0x81653bb "<stdin>", closeit=0, flags=0xbfd92f70) at Python/pythonrun.c:692
#19 0x08059d60 in Py_Main (argc=1, argv=0xbfd93074) at Modules/main.c:523
#20 0x08058e26 in main (argc=136033156, argv=0xb7dc37b4) at ./Modules/python.c:23
  • 可以新建module并将其加入sys.modules是在函数PyImport_ExecCodeModuleEx中完成的,此后,就会将新module的dict作为locals(globals)传给执行A字节码的函数,在执行A字节码时,发现需要IMPORT_NAME A,这时虚拟机会发现在sys.modules中已经存在A,所以会直接返回这个A的module,而在接下来的IMPORT_FROM时,会从这个module中试图找到B,而此时这个module里虚拟机只加载了__builtin__,__file__等属性,加载B的字节码还没执行到(也不可能执行到),所以虚拟机就会抛出无法加载B的异常。
  • 在<python源码剖析>前言中提到这样一个问题:
 [A.py]
from B import D
class C:
    pass
[B.py]
from A import C
class D:
    pass

这里无法加载D,这个问题是和本文一开始提出的问题相似的。

总结:

IMPORT_NAME字节码命令的执行流程如
  1. 假设需要import A,那么虚拟机首先在sys.modules中查找是否已经load过A,
  2. 找到则返回该对象,命令结束;
  3. 如果没有找到,那么虚拟机会新建一个module对象,
  4. 然后向module对象中添加必要的属性(builtin等),
  5. 然后用这个module中的dict作为globals(locals)执行A,
  6. 然后返回
时间: 2024-10-29 04:45:31

(转)Python中的模块循环导入问题的相关文章

python中的模块安装

python中的模块研究: 需要用import导入的模块都是用python实现的. 内建的部分是用c.c++实现的. pypi:第三方的python包. 在windows上安装python: 1.安装python到C:\PythonXX,添加系统环境变量path:C:\PythonXX. 安装pypi库的方法三种方法: 1.在pypi上下载安装包离线安装 cd  $package-dir python   setup.py  install 在windos的cmd上也可以这样安装. 3.用eas

Python中的模块介绍和使用

在Python中有一个概念叫做模块(module),这个和C语言中的头文件以及Java中的包很类似,比如在Python中要调用sqrt函数,必须用import关键字引入math这个模块,下面就来了解一下Python中的模块. 说的通俗点:模块就好比是工具包,要想使用这个工具包中的工具(就好比函数),就需要导入这个模块 1.import 在Python中用关键字import来引入某个模块,比如要引用模块math,就可以在文件最开始的地方用import math来引入. 形如: importmodu

python中os模块中文帮助

python中os模块中文帮助 python中os模块中文帮助文档文章分类:Python编程 python中os模块中文帮助文档 翻译者:butalnd 翻译于2010.1.7——2010.1.8,个人博客:http://butlandblog.appspot.com/ 注此模块中关于unix中的函数大部分都被略过,翻译主要针对WINDOWS,翻译速度很快,其中很多不足之处请多多包涵. 这个模块提供了一个轻便的方法使用要依赖操作系统的功能. 如何你只是想读或写文件,请使用open() ,如果你想

python中几大模块二

python中几大模块二 sys模块 sys模块也是python种一个非常强大的模块,功能非常的多,这里我其实也没接触到几个,暂时记录一下目前常用的几个功能函数. sys.argv 这个函数的功能是在程序外部向程序内部传递参数 .例如: import sys print(sys.argv[:]) print(sys.argv[0]) print(sys.argv[1]) print(sys.argv[2]) print(sys.argv[3]) #外部调用解释器执行该文件 python test

Python中time模块详解

在Python中,与时间处理有关的模块就包括:time,datetime以及calendar.这篇文章,主要讲解time模块. 在开始之前,首先要说明这几点: 在Python中,通常有这几种方式来表示时间:1)时间戳 2)格式化的时间字符串 3)元组(struct_time)共九个元素.由于Python的time模块实现主要调用C库,所以各个平台可能有所不同. UTC(Coordinated Universal Time,世界协调时)亦即格林威治天文时间,世界标准时间.在中国为UTC+8.DST

Python中ConfigParser模块应用

Python中ConfigParser模块应用 Python的ConfigParser模块定义了3个对INI文件进行操作的类 RawConfigParser,ConfigParser和SafeConfigParser.其中RawCnfigParser是最基础的INI文件读取类,ConfigParser.SafeConfigParser支持对%(value)s变量的解析. 下面看看怎样通过ConfigParser类来解析一个ini文件. 配置文件settings.cfg [DEFAULT] myk

python中threading模块详解(一)

python中threading模块详解(一) 来源 http://blog.chinaunix.net/uid-27571599-id-3484048.html threading提供了一个比thread模块更高层的API来提供线程的并发性.这些线程并发运行并共享内存. 下面来看threading模块的具体用法: 一.Thread的使用 目标函数可以实例化一个Thread对象,每个Thread对象代表着一个线程,可以通过start()方法,开始运行. 这里对使用多线程并发,和不适用多线程并发做

Python中optionParser模块的使用方法[转]

本文以实例形式较为详尽的讲述了Python中optionParser模块的使用方法,对于深入学习Python有很好的借鉴价值.分享给大家供大家参考之用.具体分析如下: 一般来说,Python中有两个内建的模块用于处理命令行参数: 一个是 getopt,<Deep in python>一书中也有提到,只能简单处理 命令行参数: 另一个是 optparse,它功能强大,而且易于使用,可以方便地生成标准的.符合Unix/Posix 规范的命令行说明. 示例如下: ? 1 2 3 4 5 6 7 8

【转】关于python中re模块split方法的使用

注:最近在研究文本处理,需要用到正则切割文本,所以收索到了这篇文章,很有用,谢谢原作者. 原址:http://blog.sciencenet.cn/blog-314114-775285.html 关于python中re模块split方法的使用 已有 3094 次阅读 2014-3-12 11:30 |系统分类:科研笔记 今天在写一段小代码的时候需要用到re.split()方法,在使用的过程中发现了一个以前不知道的新用法,发现这个用法还是挺实用的,就把它记录下来: >>> m = re.s