Guido用C语言创造了Python,在Python的世界中一切皆为对象.
一.C视角中的Python对象
让我们一起追溯到源头,Python由C语言实现,且向外提供了C的API http://docs.python.org/c-api/index.html .
我们思考问题的时候,可能对于对象这种东西很容易理解,而计算机能理解的只有0,1序列这样的字节序列,从根本上讲,我们所说的计算机语言中的对象只是在内存中的一块内存空间里的0,1序列而已,这些连续或者非连续的内存空间在更高层次上可以看作是一个整体.在Python中,我们所提到的一般的对象都是C中的结构体在堆Heap上申请的一块内存空间.
为了能够用C语言实现Python的面向对象的机制,需要定义一些结构体,能够操作那些对象的内存空间。
1.PyObject&PyVarObject
所有的Python对象都有一些共同的东西,我们将其高度抽象成一个结构体PyObject
C代码
- typedef struct _object{
- PyObject_HEAD
- } PyObject;
- //其实PyObject_HEAD这个宏在发行版本中的为
- int ob_refcnt;
- struct _typeobject *ob_type;
ob_refcnt,就是对象引用计数,它的存在是为了实现了Python的基于引用技术的垃圾回收机制.
还有一个是指向一个类型对象结构体的指针,用以代表该对象的类型.
在C语言的实现的时候,还有一个结构体扩展于PyObject
那便是PyVarObject,其内容为PyObject_VAR_HEAD这个宏,它比PyObject多了一个ob_size,用来表示变长对象的长度,详情见http://docs.python.org/c-api/structures.html
还有一点请大家不要搞混,这里的PyObject和PyVarObject和Python世界中的真实对象没有对应关系,这两个只是Python对象全体在C语言表示中的一种抽象.也就是说在C语言中,只要是一个Python对象结构体的数据,那么其内存的开始部分都会有上面结构体的几个变量,所以一个PyObject的指针便可以指向所有的C语言中的表示Python对象的结构体,这样在C语言的实现中,我们便可以通过这个统一的指针操作所有的内置的Python对象结构体了.
2.PyTypeObject
刚刚还有一个东西没有讲,那便是_typeobject(PyTypeObject)这个结构体,它是Python中所有类型对象的抽象,这样我们在C语言的层次里对于所有的类型对象结构体都可以通过PyTypeObject的指针来调用
C代码
- typedef struct _typeobject {
- //注意开始部分为PyObject_VAR_HEAD
- PyObject_VAR_HEAD
- char *tp_name; /* For printing, in format
- "<module>.<name>" */
- int tp_basicsize, tp_itemsize; /* For allocation */
- /* Methods to implement standard operations */
- destructor tp_dealloc;
- printfunc tp_print;
- ……
- /* More standard operations (here for
- binary compatibility) */
- hashfunc tp_hash;
- ternaryfunc tp_call;
- ……
- } PyTypeObject;
3.Python内置对象和C结构体的对应
现在Python面向对象机制的对象和类型的抽象都已经说过了,接下来我们来看下在python中真实存在的对象在C语言实现的时候是怎么样的呢?
首先需要谈的是那些Python的内置对象,这些都是C语言定义了的,当Python环境初始化后,这些对象便创建好了。
C代码
- PyAPI_DATA(PyTypeObject) PyType_Type; /* built-in ‘type‘ */
- PyAPI_DATA(PyTypeObject) PyBaseObject_Type; /* built-in ‘object‘ */
object对象在Python中是一个比较基础的对象,它在C语言中对应的结构体是PyBaseObject_Type,从C语言中的这个命名我们可以大概知道这个类是一个类型对象.
还有就是Python中的<type ‘type‘>在C语言中对应着PyType_Type
C代码
- PyTypeObject PyType_Type = {
- PyObject_HEAD_INIT(&PyType_Type)
- 0, /* ob_size */
- "type", /* tp_name */
- sizeof(PyHeapTypeObject), /* tp_basicsize */
- sizeof(PyMemberDef), /* tp_itemsize */
- ……
- };
我们再看看比较具体的整数
一个整数instance在C语言中的表示的结构体是PyIntObject
C代码
- typedef struct {
- PyObject_HEAD
- long ob_ival;
- } PyIntObject;
也就是说通过这样的结构体我们就可以在C语言的的运行时中指向Python的整数对象.
那么相应的我们Python的整数类型对象为
C代码
- yTypeObject PyInt_Type = {
- PyObject_HEAD_INIT(&PyType_Type)
- 0,
- "int",
- sizeof(PyIntObject),
- ……
- };
4.自定义对象
当我们创建一个Python对象的时候,最终都是通过Python的底层来做的,
当我们通过Python语言定义了自己的一个class A之后,Python首先根据你写的代码创建了一个A这样的class对象(类对象),然后当你需要创建A的实例的时候,其实在Python的底层都是通过A这个Class对象进行创建的。
二.Python视角中的对象体系
在单纯的Python的世界中,一切都是对象.这些对象可以分为三类,
metaclasses,classes,instance
其中classes又可以分为内置的type和用户自定义的class
下面我们通过一张图片来作详细的说明
注:
其中C的定义的方式如下(python 中继承于某类直接写在类名后面的括号中):
Python代码
- class C(object):
- ......
其中实线表示 is-kind-of 的关系 ,虚线表示is-instance-of的关系.
查看当前classes对象(instances对象没有__bases__属性)的基类的时候,可以用过classes_name.__bases__进行查看,其值为一个Tuple元组(Python支持多继承).
查看当前对象的类型的方法是object_name.__class__
我们可以通过一些测试来证实上面的图:
type为所有类的类
后记:
在看了《Python源码解析》的相关章节之后,感觉作者写的不是很条理或者自己的思维没有跟得上作者的思维。所以我就想抽一个空余时间按照自己的思维方式整理下。
自己计算机的入门语言便是C语言,所以写起来还算顺手。