1 模块简介
你一定在很多计算机科学课程上听说过作用域。它很重要,如果你不理解它的工作原理,那么就会出现一些令人困惑的错误。作用域最基本的功能就是告诉编译器一个变量什么时候是可见的。也就是说,作用域定义了你使用变量的时间和范围。当你尝试使用一些不在当前作用域的变量时,你就会得到NameError。
Python有三类作用域:
- 局部作用域;
- 全局作用域;
- 非局部作用域(Python 3 中新增);
2 模块使用
2.1 局部作用域
局部作用域是Python中使用最多的作用域。当你在一段代码块中创建一个变量,它将会在最近的作用域中使用。所有的作用域组成的集合就是代码块环境。也就是说,默认是在局部作用域中处理所有的任务。如果你想要不同的作用域,那么你需要将变量设置为全局作用域或非局部作用域。
现在,我们使用Python的解释器创建一个简单的例子,来展示局部作用域任务。
>>> x = 10>>> def my_func(a,b):... print(x)... print(z)... >>> my_func(1,2)10Traceback (most recent call last): File "<stdin>", line 1, in <module> File "<stdin>", line 3, in my_func NameError: global name ‘z‘ is not defined
这里,我们创建了变量x以及一个入参为两个参数的简单函数。它将会打印x和z。请记住,我们还没有定义z,所以当我们调用这个函数时,我们将会获得NameError。这是因为z还没有定义或者它在作用域外部。如果你在调用函数之前定义z,那么就会发现z,你就不会获得NameError。
如果你尝试访问函数内部的变量,那么你也会获得NameError。
>>> def my_func(a,b):... i = 2... print(x)... >>> if __name__ == "__main__":... x = 10... my_func(1,2)... print(i)... 10Traceback (most recent call last): File "<stdin>", line 4, in <module> NameError: name ‘i‘ is not defined
变量i仅仅在函数内部定义,所以当你运行这段代码时,你将会得到NameError。
我们稍微修改一下上面的代码,将下面的代码存储到文件中,并运行。
def my_func(a,b): x = 5 print(x)if __name__ == "__main__": x = 10 my_func(1,2) print(x)
你认为将会发生什么?10打印两次?实际上并不是。原因就是我们现在有两个x变量。my_func函数中的变量x是局部函数作用域,它将会覆盖函数外部的变量x。当我们调用my_func函数时,我们打印5而非10。当函数返回时,my_func函数中的变量x会被回收,函数外的变量x将会起作用,这就是为什么最后一行语句打印出10。
如果你想了解具体的技巧,你可以在函数中的赋值语句前打印x,如下所示,
>>> def my_func(a,b):... print(x)... x = 5... print(x)... >>> if __name__ == "__main__":... x = 10... my_func(1,2)... print(x)
当你运行这段代码时,你将会得到如下的异常,
Traceback (most recent call last): File "<stdin>", line 3, in <module> File "<stdin>", line 2, in my_func UnboundLocalError: local variable ‘x‘ referenced before assignment
这个异常发生,是因为Python提示你在my_func函数中后赋值给x,由于x还没有定义,因此它抛出异常。
2.2 全局作用域
Python包括global语句。它是Python的一个关键字。global语句定义了这个变量可以在随后的代码块中作为变量使用。虽然你可以在声明全局之前创建一个名称,但这是非常不鼓励的。让我们尝试使用global来修复上一个例子抛出的异常:
def my_func(a,b): global x print(x) x = 5 print(x)if __name__ == "__main__": x = 10 my_func(1,2) print(x)
这段代码的输出是,
10 5 5
通过将x定义为全局变量,我们告诉Pyton在函数中第一个打印函数中首先使用第一个定义的x。然后我们给x赋予新值5,在退出函数前再次打印。你将会注意到现在x是全局变量,当我们到达代码块的最后一个输出语句时,x依然是5。
让我们混合使用global和local来做一些有意思的事情,
def my_func(a,b): global c b,a = a,b d = ‘Mike‘ print(a,b,c,d) a , b , c , d = 1 , 2 , ‘c is global‘ , 4my_func(a,b) print(a , b , c , d)
在这里,我们将变量c设置为全局变量。这个将会导致在函数内部和外部,c都会输出相同的值。我们在函数内部交换变量a和b,可以显示出我们在函数内部对其进行了交换,但是在函数外部,并没有修改二者。这也显示出变量a和b并不是全局变量,你应该可以看到如下的输出结果:
(2, 1, ‘c is global‘, ‘Mike‘) (1, 2, ‘c is global‘, 4)
我在此想提醒你不要在函数内部修改全局变量。这在Python社区中是一个不好的例子,它也会导致调试更加困难。
现在,我们已经理解了局部和全局变量,下面我们将要了解非局部变量。
2.3 非局部作用域
Python 3新增了一个关键词--nonlocal。关键词nonlocal增加了一个作用域用于覆盖内部作用域。你可以阅读PEP 3104。下面一段代码可以很好的解释非局部作用域。最常见的例子就是创建一个自增函数,
def counter(): num = 0 def incrementer(): num += 1 return num return incrementer
如果你运行这段代码,你将会得到UnboundLocalError这个错误,因为变量num在内部函数中在赋值之前引用。让我们增加局部作用域,
>>> def counter():... num = 0... def incrementer():... nonlocal num... num += 1... return num... return incrementer... >>> >>> c = counter()>>> c <function counter.<locals>.incrementer at 0x7f67735ffea0>>>> c()1>>> c()2>>> c()3
现在我们定义的自增函数已按照我们期望开始工作。这种类型的函数被称为closure(闭包)。闭包就是一个将非局部变量封装起来的代码块。闭包背后的思想就是你可以在函数外部引用这些变量。
nonlocal允许你将变量分配到作用域外,但不是全局作用域。你不能在counter函数中使用nonlocal,因为它尝试着将其分配到全局作用域。你可以尝试一下,你将会得到SyntaxError。所以你必须在嵌套函数中使用nonlocal。
2.4 总结
在本文中,我们了解了通过Python关键词global和nonlocal来修改变量的引用方式。我们学习了在哪里使用以及为什么。我们也学习了局部作用域。