《python源码剖析》笔记 python中的字符串对象

本文为senlie原创,转载请保留此地址:http://blog.csdn.net/zhengsenlie

1.      PyStringObject --> 变长不可变对象

typedef struct{
           PyObject_VAR_HEAD//ob_size变量保存着对象中维护的可变长度内存的大小
           longob_shash; //缓存该对象的hash值,用于dict的查询
           intob_sstate; //标志该对象是否经过intern机制的处理
           char ob_sval[1];// 字符指针,指向一段内存
} PyStringObject;

PyString_Type --> PyStringObject的类型对象。

PyTypeObjectPyString_Type = {
PyObject_HEAD_INIT(&PyType_Type)
0,
"str",
sizeof(PyStringObject),
sizeof(char),
//……
(reprfunc)string_repr,  /* tp_repr */
&string_as_number,  /* tp_as_number */
&string_as_sequence,  /* tp_as_sequence */
&string_as_mapping,  /* tp_as_mapping */
(hashfunc)string_hash,  /* tp_hash */
0,  /* tp_call */
//……
string_new,  /* tp_new */
PyObject_Del,  /* tp_free */
};

PyStringObject对数值操作、序列操作和映射操作都支持

2.      创建PyStringObject对象

两种途径:

PyObject *PyString_FromString(const char *str)
PyObject *PyString_FromStringAndSize(const char *str, intsize)

PyString_FromString

1.      判断字符串长度:PY_SSIZE_T_MAX

2.      处理null string

3.      处理单个字符

4.      申请内存,创建新的PyStringObject对象,并初始化。

5.      intern(共享)长度较短的PyStringObject对象

3.      字符串对象的intern机制

对于intern之后的字符串,在整个python的运行期间,比如“Ruby”,系统中都只有唯一的一个与”Ruby”字符串对应的PyStringObject对象。

如果对于a应用了intern机制,那么之后要创建b的时候,Python会首先在系统中记录的已经被intern机制处理了的PyStringObject对象中查找,如果发现该字符数组对应的PyStringObject对象已经存在了,就直接将该对象的引用返回。

interned是(key, value)集合 --> key, value是对应的PyStringObject对象的引用

interned中的指针还能作为a的有效引用,因此在将a的PyObject指针作为key和value添加到interned中后,要将a的引用计数减2,不然a在python结束之前永远不会被删除。

Python在运行时创建了一个PyStringObject对象temp后,基本上都会调用PyString_InternInPlace对temp进行处理,intern机制会减少temp的引用计数,temp对象会由于引用计数减为0而被销毁。

4.      字符缓冲池

1)  创建 PyStringObject 对象”P”

2)   对对象”P”进行 Intern 操作

3)  将对象”P”缓存至字符缓冲池中

好像只是为了加速查找?

5.      PyStringObject效率相关问题

字符串连接操作

“+”效率低下,连接N个PyStringObject要进行N-1次内存申请和搬运的工作

推荐用join

《python源码剖析》笔记 python中的字符串对象

时间: 2024-10-25 02:43:25

《python源码剖析》笔记 python中的字符串对象的相关文章

Python源码剖析笔记3-Python执行原理初探

Python源码剖析笔记3-Python执行原理初探 本文简书地址:http://www.jianshu.com/p/03af86845c95 之前写了几篇源码剖析笔记,然而慢慢觉得没有从一个宏观的角度理解python执行原理的话,从底向上分析未免太容易让人疑惑,不如先从宏观上对python执行原理有了一个基本了解,再慢慢探究细节,这样也许会好很多.这也是最近这么久没有更新了笔记了,一直在看源码剖析书籍和源码,希望能够从一个宏观层面理清python执行原理.人说读书从薄读厚,再从厚读薄方是理解了

Python源码剖析笔记0 ——C语言基础

python源码剖析笔记0--C语言基础回顾 要分析python源码,C语言的基础不能少,特别是指针和结构体等知识.这篇文章先回顾C语言基础,方便后续代码的阅读. 1 关于ELF文件 linux中的C编译得到的目标文件和可执行文件都是ELF格式的,可执行文件中以segment来划分,目标文件中,我们是以section划分.一个segment包含一个或多个section,通过readelf命令可以看到完整的section和segment信息.看一个栗子: char pear[40]; static

python源码剖析笔记1——Python对象初见

python源码剖析笔记1--Python对象初见 工作整两年了,用python最多,然而对于python内部机制不一定都清楚,每天沉醉于增删改查的简单逻辑编写,实在耗神.很多东西不用就忘记了,比如C语言,正好,python源码用C写的,分析python源码的同时又能温故C语言基础,实在是件很好的事情.另外,还有陈儒大神的<python源码剖析>做指引,分析也不至于没头没脑.期望在一个月的业余时间,能有所小成,以此为记. 1 python中的对象 python中,一切东西都是对象,在c语言实现

Python源码剖析笔记4-内建数据类型

Python源码剖析笔记4-内建数据类型 Python内建数据类型包括整数对象PyIntObject,字符串对象PyStringObject,列表对象PyListObject以及字典对象PyDictObject等.整数对象之前已经分析过了,这一篇文章准备分析下余下几个对象,这次在<python源码剖析>中已经写的很详细的部分就不赘述了,主要是总结一些之前看书时疑惑的地方. 1 整数对象-PyIntObject 参见 python整数对象. 2 字符串对象-PyStringObject 2.1

Python源码剖析笔记2-Python整数对象

Python源码剖析笔记2-Python整数对象 本文简书地址: http://www.jianshu.com/p/0136ed90cd46 千里之行始于足下,从简单的类别开始分析,由浅入深也不至于自己丧失信心.先来看看Python整数对象,也就是python中的PyIntObject对象,对应的类型对象是PyInt_Type. 1 Python整数对象概览 为了性能考虑,python中对小整数有专门的缓存池,这样就不需要每次使用小整数对象时去用malloc分配内存以及free释放内存.pyth

Python源码剖析笔记6-函数机制

Python的函数机制是很重要的部分,很多时候用python写脚本,就是几个函数简单解决问题,不需要像java那样必须弄个class什么的. 本文简书地址:http://www.jianshu.com/p/d00108741a18 1 函数对象PyFunctionObject PyFunctionObject对象的定义如下: typedef struct { PyObject_HEAD PyObject *func_code; /* A code object */ PyObject *func

Python源码剖析笔记5-模块机制

本文简书地址: http://www.jianshu.com/p/14586ec50ab6 python中经常用到模块,比如import xxx,from xxx import yyy这样子,里面的机制也是需要好好探究一下的,这次主要从黑盒角度来探测模块机制,源码分析点到为止,详尽的源码分析见陈儒大神的<python源码剖析>第14章. 1 如何导入模块 首先来看一个导入模块的例子.创建一个文件夹demo5,文件夹中有如下几个文件. [email protected] ~/demo5 $ ls

Python 源码剖析(四)【LIST对象】

四.LIST对象 1.PyListObject对象 2.PyListObject的创建与维护 3.PyListObject 对象缓冲池 4.Hack PyListObject 1.PyListObject对象 PyListObject 对象是变长对象,而且还是一个可变对象: [listobject.h] typedef struct { PyObject_VAR_HEAD /* Vector of pointers to list elements. list[0] is ob_item[0],

《python源码剖析》笔记 python虚拟机中的一般表达式

本文为senlie原创,转载请保留此地址:http://blog.csdn.net/zhengsenlie 1.字节码指令 LOAD_CONST:从consts表中读取序号为i的元素并压入到运行时栈中 STORE_NAME:改变local名字空间.从符号表names取序号为i的元素作为变量名, 取运行时栈的栈顶元素作为变量值,完成从变量名到变量值的映射关系的创建. BUILD_MAP:创建一个空的PyDictObject对象,并压入运行时栈 DUP_TOP:将栈顶元素的引用计数增加1,并将它再次

《python源码剖析》笔记 python虚拟机中的函数机制

本文为senlie原创,转载请保留此地址:http://blog.csdn.net/zhengsenlie 1.Python虚拟机在执行函数调用时会动态地创建新的 PyFrameObject对象, 这些PyFrameObject对象之间会形成PyFrameObject对象链,模拟x86平台上运行时栈 2.PyFuctionObject对象 typedef struct { PyObject_HEAD PyObject *func_code: //对应函数编译后的PyCodeObject对象 Py