python中基于descriptor的一些概念（上）

1. 前言

python在2.2版本中引入了descriptor功能，也正是基于这个功能实现了新式类(new-styel class)的对象模型，

同时解决了之前版本中经典类(classic class)系统中出现的多重继承中的MRO(Method Resolution Order)的问题，

同时引入了一些新的概念，比如classmethod, staticmethod, super,Property等，这些新功能都是基于descriptor

而实现的。总而言之，通过学习descriptor可以更多地了解python的运行机制。我在这也大概写一个汇总，

写一下对这些东西的理解。欢迎大家讨论。

在这里，为文章中使用的词汇做一下说明：

函数：指的是第一个参数不是self的函数，不在类中定义的函数

方法：指是的第一个参数是self的函数

实例：类的对象，instance

对象模型：就是实现对象行为的整个框架，这里分为经典和新的两种

使用的python版本为python 2.7.2

2. 新式类与经典类

首先来了解一下新式类与经典类的区别，从创建方法上可以明显的看出：

#新式类
class C(object):
pass
#经典类
class B:
pass

简单的说，新式类是在创建的时候继承内置object对象（或者是从内置类型，如list,dict等），而经典类是直

接声明的。使用dir()方法也可以看出新式类中定义很多新的属性和方法，而经典类好像就2个：

这些新的属性和方法都是从object对象中继承过来的。

2.1 内置的object对象

内置的object对象是所有内置，object对象定义了一系列特殊的方法实现所有对象的默认行为。

1. __new__，__init__方法

这两个方法是用来创建object的子类对象，静态方法__new__()用来创建类的实例，然后再调用

__init__()来初始化实例。

2. __delattr__, __getattribute__, __setattr__方法

对象使用这些方法来处理属性的访问

3. __hash__, __repr__, __str__方法

print(someobj)会调用someobj.__str__()，如果__str__没有定义，则会调用someobj.__repr__()，

__str__()和__repr__()的区别：

默认的实现是没有任何作用的
__repr__的目标是对象信息唯一性
__str__的目标是对象信息的可读性
容器对象的__str__一般使用的是对象元素的__repr__
如果重新定义了__repr__，而没有定义__str__，则默认调用__str__时，调用的是__repr__
也就是说好的编程习惯是每一个类都需要重写一个__repr__方法，用于提供对象的可读信息，
而重写__str__方法是可选的。实现__str__方法，一般是需要更加好看的打印效果，比如你要制作
一个报表的时候等。

可以允许object的子类重载这些方法，或者添加新的方法。

2.2 类的方法

新的对象模型中提供了两种类级别的方法，静态方法和类方法，在诸多新式类的特性中，也只有类方法这个

特性，和经典对象模型实现的功能一样。

2.2.1 静态方法

静态方法可以被类或者实例调用，它没有常规方法的行为(比如绑定，非绑定，默认的第一个self参数)，当有一

堆函数仅仅是为了一个类写的时候，采用静态方法声明在类的内部，可以提供行为上的一致性。

创建静态方法的代码如下，使用装饰符@staticmethod进行创建：

可以看出，不管是类调用，还是实例调用静态方法，都是指向同一个函数对象

2.2.2 类方法

也是可以通过类和它的实例进行调用，不过它是有默认第一个参数，叫做是类对象，一般被

命名为cls，当然你也可以命名为其它名字，这样就你可以调用类对象的一些操作，

代码如下，使用装饰符@classmethod创建：

2.3 新式类(new-style class)

新式类除了拥有经典类的全部特性之外，还有一些新的特性。比如__init__发生了变化，

新增了静态方法__new__

2.3.1 init方法

据说在python2.4版本以前，使用新式类时，如果类的初始化方法没有定义，调用的

时候写了多余的参数，编译器不会报错。我现在的python 2.7会报错，还是觉得会报错

比较好点，下面给出新式类和经典类运行这个例子的情况：

2.3.2 new静态方法

新式类都有一个__new__的静态方法，它的原型是object.__new__(cls[, ...])

cls是一个类对象，当你调用C(*args, **kargs)来创建一个类C的实例时，python的内部调用是

C.__new__(C, *args, **kargs)，然后返回值是类C的实例c，在确认

c是C的实例后，python再调用C.__init__(c, *args, **kargs)来初始化实例c。

所以调用一个实例c = C(2)，实际执行的代码为：

c = C.__new__(C, 2)
if isinstance(c, C):
C.__init__(c, 23)#__init__第一个参数要为实例对象

object.__new__()创建的是一个新的，没有经过初始化的实例。当你重写__new__方法时，可以不

用使用装饰符@staticmethod指明它是静态函数，解释器会自动判断这个方法为静态方法。如果

需要重新绑定C.__new__方法时，只要在类外面执行C.__new__ = staticmethod(yourfunc)就可以了。

可以使用__new__来实现Singleton单例模式：

class Singleton(object):
    _singletons = {}
    def __new__(cls):
        if not cls._singletons.has_key(cls):            #若还没有任何实例
            cls._singletons[cls] = object.__new__(cls)  #生成一个实例
        return cls._singletons[cls]                             #返回这个实例

运行结果如下：

使用id()操作，可以看到两个实例指向同一个内存地址。Singleton的所有子类也有这一

特性，只有一个实例对象，如果它的子类定义了__init__()方法，那么必须保证它的

__init__方法能够安全的同一个实例进行多次调用。

2.4. 新式类的实例

除了新式类本身具有新的特性外，新式类的实例也具有新的特性。比如它拥有Property功能，该

功能会对属性的访问方式产生影响；还有__slots__新属性，该属性会对生成子类实例产生影响；还

添加了一个新的方法__getattribute__，比原有的__getattr__更加通用。

2.4.1 Property

在介绍完descriptor会回过头来讲这个。

2.4.2 slots属性

通常每一个实例x都会有一个__dict__属性，用来记录实例中所有的属性和方法，也是通过这个字典，

可以让实例绑定任意的属性。而__slots__属性作用就是，当类C有比较少的变量，而且拥有__slots__属性时，

类C的实例就没有__dict__属性，而是把变量的值存在一个固定的地方。如果试图访问一个__slots__中没有

的属性，实例就会报错。这样操作有什么好处呢？__slots__属性虽然令实例失去了绑定任意属性的便利，

但是因为每一个实例没有__dict__属性，却能有效节省每一个实例的内存消耗，有利于生成小而精

干的实例。

为什么需要这样的设计呢？

在一个实际的企业级应用中，当一个类生成上百万个实例时，即使一个实例节省几十个字节都可以节省

一大笔内存，这种情况就值得使用__slots__属性。

怎么去定义__slots__属性？
__slots__是一个类变量，__slots__属性可以赋值一个包含类属性名的字符串元组，或者是可迭代变量，或者

是一个字符串，只要在类定义的时候，使用__slots=aTuple来定义该属性就可以了：

可以看出实例a中没有__dict__字典，而且不能随意添加新的属性，不定义__slots__是可以随意添加的：

使用时__slots__时需要注意的几点：

1. 当一个类的父类没有定义__slots__属性，父类中的__dict__属性总是可以访问到的，所以只在子

类中定义__slots__属性，而不在父类中定义是没有意义的。

2. 如果定义了__slots属性，还是想在之后添加新的变量，就需要把‘__dict__‘字符串添加到__slots__的

元组里。

3. 定义了__slots__属性，还会消失的一个属性是__weakref__，这样就不支持实例的weak reference，

如果还是想用这个功能，同样，可以把‘__weakref__‘字符串添加到元组里。

4. __slots__功能是通过descriptor实现的，会为每一个变量创建一个descriptor。

5. __slots__的功能只影响定义它的类，因此，子类需要重新定义__slots__才能有它的功能。

2.4.3 getattribute方法

对新式类的实例来说，所有属性和方法的访问操作都是通过__getattribute__完成，

这是由object基类实现的。如果有特殊的要求，可以重载__getattribute__方法，下面

实现一个不能使用append方法的list：

2.4.4 实例的方法

经典的与新的对象模型都允许一个实例拥有私有的属性和方法（可以通过绑定和重绑定）。实例

的私有属性会覆盖掉类中定义的同名属性，举例说明：

然而在python中，隐式调用实例的私有特殊方法时，新的对象模型和经典对象模型表现上不太一样。

在经典对象模型中，无论是显示调用还是隐式调用特殊方法，都会调用实例中后绑定的特殊方法。

而在新的对象模型中，除非显式地调用实例的特殊方法，否则python总是会去调用类中定义的特殊方法，

如果没有定义的话，就报错。代码如下：

经典类：

新式类：

调用a[1]，将产生一个隐式的__getitem__方法的调用，在新式类中，因为类中没有定义这个方法，也不是

object基类有的方法，所以报错。需要显示地调用才可以运行。

2.5 新的对象模型

在新的对象模型中，继承方式和经典对象模型大体相同，一个关键的区别就是新式类能够从python的内置

类型中继承，而经典类不行。

2.5.1 多继承

新式类同样支持多继承，但是如果新式类想要从多个内置类型中继承生成一个新类的话，则这些内置类必须是

经过精心设计，能够互相兼容的。显然，python也没会让你随意的从多个内置类中进行多继承，想创建一个超级类

不是那么容易的。。。通常情况下，至多可以继承一个内置类，比如list, set, dict等。

2.5.2 MRO(Method Resolution Order，方法解析顺序)

对于下图的多继承关系：

b = A()，当调用b.a的时候会发生什么事呢？

在经典对象模型中，方法和属性的查找链是按照从左到右，深度优先的方式进行查找。所以当A的实例b

要使用属性a时，它的查找顺序为:A->B->D->C->A，这样做就会忽略类C的定义a，而先找到的基类D的

属性a，这是一个bug，这个问题在新式类中得到修复，新的对象模型采用的是从左到右，广度优先的方式

进行查找，所以查找顺序为A->B->C->D，可以正确的返回类C的属性a。

经典类：

新式类：

这个顺序的实现是通过新式类中特殊的只读属性__mro__，类型是一个元组，保存着解析顺序信息。只能通过

类来使用，不能通过实例调用。

顺序还和继承时，括号中写的父类顺序有关：

2.5.3 协作式调用父类方法

当子类重写了父类的一个方法时，通常会调用父类的同名方法做一些工作，这是比较常见的使用

方式--使用非绑定语法来调用父类的方法。不过在多继承中，这种方法有缺馅：

可以看到，基类A的方法重复运行了两次。怎样才能确保父类中的方法只被顺序的调用一次呢？

在新的对象系统中，有一种特殊的方法super(aclass, obj)，可以返回obj实例的一个特殊类型

superobject(超对象，不是简单的父类的对象)，当我们使用超对象调用父类的方法时，就

能保证只被运行一次：

可以看到，D的父类中所有的foo方法都得到执行，并且基类A的foo方法只执行了一次。如果养成了

使用super去调用父类方法的习惯，那么你的类就可以适应无论多么复杂的继承调用结构。super()

可以看成是更加安全调用父类方法的一种新方式。

时间： 2024-10-23 05:29:21

python中基于descriptor的一些概念（上）的相关文章

python中基于descriptor的一些概念（下）

@python中基于descriptor的一些概念(下) 3. Descriptor介绍 3.1 Descriptor代码示例 3.2 定义 3.3 Descriptor Protocol(协议) 3.4 Descriptor调用方法 4. 基于Descriptor实现的功能 4.1 property 4.2 函数和方法,绑定与非绑定 4.3 super 5. 结尾 3. Descriptor介绍 3.1 Descriptor代码示例 class RevealAccess(object):

python 中关于descriptor的一些知识问题

这个问题从早上日常扫segmentfault上问题开始有个问题是 class C(object): @classmethod def m(): pass m()是类方法,调用代码如下: C.m() 但我想当成属性的方式调用,像这样: C.m 请问该怎么弄呢? 请最好提供个简单的例子, 多谢! 这里我开始误会了他的意思,以为他是想直接使用C().m调用这个方法,如果是这样,直接将装饰器@classmathod改成@property就可以达到效果了. 但是这里他想要达到的效果是C.m 也就是说在不

python中的 descriptor

学好和用好python, descriptor是必须跨越过去的一个点,现在虽然Python书籍花样百出,但是似乎都是在介绍一些Python库而已,对Python语言本身的关注很少,或者即使关注了,但是能够介绍把 dscriptor介绍清楚的,是很少的,到目前,我自己还没有见到过. 一个attr能被称为descriptor,除了需要定义 descriptor protocol 规定的方法外,这个attr必须是属于某个class的,不能是属于某个instance 一.Python中的descript

Python中的Descriptor

Python中的描述符描述符的定义: 通常情况下,我们可以认为"假设对象的某个属性被绑定了(__get__, __set__, __delete__)这三个方法中的任意一个方法",那么我们称该属性为"描述符" class Foo(object): def init(self, name, age): self.name = name self.age = age foo = Foo("pizza", 18) 我们不能称 foo.name, fo

python中模块和包的概念

1.模块一个.py文件就是一个模块.这个文件的名字是:模块名.py.由此可见在python中,文件名和模块名的差别只是有没有后缀.有后缀是文件名,没有后缀是模块名. 每个文件(每个模块)都是一个独立的名称空间,也就是说可以在两个(多个)文件中出现同名的函数. import,from.....import...两种导入的区别: 1.import 按模块区分拥有独立的命名空间,要是想使用模块中的函数需要使用模块名.函数名的方式来使用. 可以使用import.....as.

python中基于tcp协议的通信（数据传输）

tcp协议:流式协议(以数据流的形式通信传输).安全协议(收发信息都需收到确认信息才能完成收发,是一种双向通道的通信) tcp协议在OSI七层协议中属于传输层,它上承用户层的数据收发,下启网络层.数据链路层.物理层.可以说很多安全数据的传输通信都是基于tcp协议进行的. 为了让tcp通信更加方便需要引入一个socket模块(将网络层.数据链路层.物理层封装的模块),我们只要调用模块中的相关接口就能实现传输层下面的繁琐操作. 简单的tcp协议通信模板:(需要一个服务端和一个客户端) 服务端: fr

Python 中模块间全局变量的使用上的注意

最近用Python写代码,需要用到模块间的全局变量. 网上四处搜索,发现普遍做法是把全局变量放到一个独立的模块中,使用时,导入此全局变量模块即可. 但是在实际使用过程中发现了些小问题:在使用如下代码导入全局变量模块时,各个模块获取到的全局变量都是初始值. from module import global_var 但是如果使用「模块名.全局变量名」来访问时,却又是正常的: import module print module.global_var 为了弄清其中的原委,我写了个测试程序来仔细查看其

Python中的端口协议之基于UDP协议的通信传输

UDP协议: 1.python中基于udp协议的客户端与服务端通信简单过程实现 2.udp协议的一些特点(与tcp协议的比较) ------------------------------------------------------------------------------------------------------------------------------------- 一.UDP协议:OSI七层协议中的传输协议的一种(另外一种tcp协议),他们都是一种端口协议与TCP协

理解Python中的闭包

1.定义闭包是函数式编程的一个重要的语法结构,函数式编程是一种编程范式 (而面向过程编程和面向对象编程也都是编程范式).在面向过程编程中,我们见到过函数(function):在面向对象编程中,我们见过对象(object).函数和对象的根本目的是以某种逻辑方式组织代码,并提高代码的可重复使用性(reusability).闭包也是一种组织代码的结构,它同样提高了代码的可重复使用性. 不同编程语言实现闭包的方式是不同的,python中闭包从表现形式上看,如果在一个内部函数里,对在外部作用域(但不是

python中基于descriptor的一些概念（上）

python中基于descriptor的一些概念（上）

1. 前言

2. 新式类与经典类

2.1 内置的object对象

2.2 类的方法

2.2.1 静态方法

2.2.2 类方法

2.3 新式类(new-style class)

2.3.1 __init__方法

2.3.2 __new__静态方法

2.4. 新式类的实例

2.4.1 Property

2.4.2 __slots__属性

2.4.3 __getattribute__方法

2.4.4 实例的方法

2.5 新的对象模型

2.5.1 多继承

2.5.2 MRO(Method Resolution Order， 方法解析顺序)

2.5.3 协作式调用父类方法

python中基于descriptor的一些概念（上）的相关文章

2.3.1 init方法

2.3.2 new静态方法

2.4.2 slots属性

2.4.3 getattribute方法

2.5.2 MRO(Method Resolution Order，方法解析顺序)