深入详解python传值问题及内存管理机制

在比较浅层次上我们通过说明如下问题来进一步深入了解python内存管理机制:

python中到底是“传引用”还是“传值”呢???

这个问题的回答是:看情况。有的是传值,有的是传引用。

判断的依据是看对象的可变性,而这一点又取决于对象的类型。故在python中的说法是对象可变的还是不可变的。

基本数据类型(整型及其他数据类型,字符串)及元组是不可变的,参数传递的是形参,也就是传过来的是原值的一个拷贝,在函数中改变形参的值实参不会发生变化:

def func(a)

列表、字典、类及类实例是可变数据类型,作为参数传递则是原值的一个引用,函数对形参列表进行了改变,那么实参也相应的发生变化:

def func(a=[])

可以使用元组进行参数传递,因为元组是不允许改变的.

一个常用的例子是list.sort(),它是直接在列表上排序而不是返回它,可以通过自己复制一个拷贝:       newlist=list(mylist),或者newlist=mylist[:]

 

python中复制对象(a=b)也是同样的道理,不可变对象被真正复制,而可变对象只是复制了一个对它的引用。

例1:

list0=[1,2,’a’,[‘b’,’c’]]

list1= list0

list1[0]=11

list0[3][0]= ’d’

print list1 #[ 11,2,’a’,[‘d’,’c’] ]

print list0 #[ 11,2,’a’,[‘d’,’c’] ]

list0中1,2,’a’均为不可变对象,[‘b’,’c’]为可变对象

例2:(浅拷贝)

list0=[1,2,’a’,[‘b’,’c’]]

list1=list(list0)

list1[0]=11

list0[3][0]= ’d’

print list1 #[ 11,2,’a’,[‘d’,’c’] ]

print list0 #[ 1 ,2,’a’,[‘d’,’c’] ]

list0中1,2,’a’均为不可变对象,[‘b’,’c’]为可变对象

经过上面的讲解,可能我们已经初步认识到哪些是引用,哪些是传值的了,至此,我们还没有真正了解它的内部原理:

在来看如下例子:

>>a=1

>>b=a

id(a)==id(b),此时b和a指向同一地址,此时b也是对a的一个引用

当b的值改变时会指向其他地址,即重新分配内存

>>b+=1

id(a)!=id(b)

>>a=[1,2,3]

>>b=a

此时b是a的一个引用。id(a)==id(b)

>>b=[4,5,6]

此时b重新分配内存。

另外一点说明:当我们定义的变量与函数同名时,再使用系统函数,python会提示不可用,这时我们要 del varible将变量删除

如:>>>list=[1,2,3]

>>>newlist=list(list)#这时外面的list也会被当做列表来使用造成错误

>>>del list

原理:

python中任何变量都是对象,所以参数只支持引用传递方式。即通过名字绑定的机制,把实际参数的值和形式参数的名称绑定在一起,形式参数和实际参数指向内存中的同一个存储空间。

python中任何变量都是对象,看上去不可变的对象是值传递其实也是传递的引用,之所以改变形参后,形参和实参未保持一致是因为不可变对象的改变都是一种重新赋值(即重新分配内存的过程),而可变对象的改变值就是在原内存地址基础上add或append,不是一个重新赋值的过程,通过上面的例子我们可以发现,可变对象重新赋值地址是同样会发生变化的。

进一步我们来解读python 的内存管理机制:

Python引入了一个机制:引用计数

python内部使用引用计数,来保持追踪内存中的对象,Python内部记录了对象有多少个引用,即引用计数,当对象被创建时就创建了一个引用计数,当对象不再需要时,这个对象的引用计数为0时,它被垃圾回收。

总结一下对象会在一下情况下引用计数加1:

1.对象被创建:x=4

2.另外的别人被创建:y=x

3.被作为参数传递给函数:foo(x)

4.作为容器对象的一个元素:a=[1,x,‘33‘]

引用计数减少情况

1.一个本地引用离开了它的作用域。比如上面的foo(x)函数结束时,x指向的对象引用减1。

2.对象的别名被显式的销毁:del x ;或者del y

3.对象的一个别名被赋值给其他对象:x=789

4.对象从一个窗口对象中移除:myList.remove(x)

5.窗口对象本身被销毁:del myList,或者窗口对象本身离开了作用域。

垃圾回收

1、当内存中有不再使用的部分时,垃圾收集器就会把他们清理掉。它会去检查那些引用计数为0的对象,然后清除其在内存的空间。当然除了引用计数为0的会被清除,还有一种情况也会被垃圾收集器清掉:当两个对象相互引用时,他们本身其他的引用已经为0了。

2、垃圾回收机制还有一个循环垃圾回收器, 确保释放循环引用对象(a引用b, b引用a, 导致其引用计数永远不为0)。

在Python中,许多时候申请的内存都是小块的内存,这些小块内存在申请后,很快又会被释放,由于这些内存的申请并不是为了创建对象,所以并没有对象一级的内存池机制。这就意味着Python在运行期间会大量地执行malloc和free的操作,频繁地在用户态和核心态之间进行切换,这将严重影响Python的执行效率。为了加速Python的执行效率,Python引入了一个内存池机制,用于管理对小块内存的申请和释放。

内存池机制

Python提供了对内存的垃圾收集机制,但是它将不用的内存放到内存池而不是返回给操作系统。

Python中所有小于256个字节的对象都使用pymalloc实现的分配器,而大的对象则使用系统的 malloc。另外Python对象,如整数,浮点数和List,都有其独立的私有内存池,对象间不共享他们的内存池。也就是说如果你分配又释放了大量的整数,用于缓存这些整数的内存就不能再分配给浮点数。

在Python中,许多时候申请的内存都是小块的内存,这些小块内存在申请后,很快又会被释放,由于这些内存的申请并不是为了创建对象,所以并没有对象一级的内存池机制。这就意味着Python在运行期间会大量地执行malloc和free的操作,频繁地在用户态和核心态之间进行切换,这将严重影响 Python的执行效率。为了加速Python的执行效率,Python引入了一个内存池机制,用于管理对小块内存的申请和释放。这也就是之前提到的 Pymalloc机制。

关于内存管理机制引用自:http://blog.chinaunix.net/uid-26602509-id-3506965.html

接着,我们继续谈python内存情况,在面试过程中被问到

python中的list在内存中是以数组方式存储还是链表的方式呢???

突然一下子就被问住了,想想用起来开始觉得是链表,后来又觉得是数组,模棱两可,通过查阅一些资料,发现list的存储方式是arraylist(动态数组),与它相对应的是linkedlist(链表),arraylist其实就是数组了,其实就相当于C++中的vector,只不过这时的list可以存储不同类型的元素。那么我们明白了这些后,使用的时候才会更加注意对于插入或者删除频繁的时候,list效率是比较低的,毕竟它存储形式是arraylist。

python中的tuple存储形式是什么呢?

tuple在内存中的存储形式就是常量数组,因为它是不可变的数据类型,所以常量数组估计大家都能理解。

python中的dictionary存储形式是什么呢?

字典相当于C++标准库中的map

字符串呢

字符串其实就是不能修改的list,也是数组的形式,这和c/c++是一致的。

时间: 2024-10-06 07:34:55

深入详解python传值问题及内存管理机制的相关文章

[转载] python的内存管理机制

本文为转载,原作为http://www.cnblogs.com/CBDoctor/p/3781078.html,请大家支持原作者 先从较浅的层面来说,Python的内存管理机制可以从三个方面来讲 (1)垃圾回收 (2)引用计数 (3)内存池机制 一.垃圾回收: python不像C++,Java等语言一样,他们可以不用事先声明变量类型而直接对变量进行赋值.对Python语言来讲,对象的类型和内存都是在运行时确定的.这也是为什么我们称Python语言为动态类型的原因(这里我们把动态类型可以简单的归结

python的内存管理机制

先从较浅的层面来说,Python的内存管理机制可以从三个方面来讲 (1)垃圾回收 (2)引用计数 (3)内存池机制 一.垃圾回收: python不像C++,Java等语言一样,他们可以不用事先声明变量类型而直接对变量进行赋值.对Python语言来讲,对象的类型和内存都是在运行时确定的.这也是为什么我们称Python语言为动态类型的原因(这里我们把动态类型可以简单的归结为对变量内存地址的分配是在运行时自动判断变量类型并对变量进行赋值). 二.引用计数: Python采用了类似Windows内核对象

python的内存管理机制(zz)

本文转载自:http://www.cnblogs.com/CBDoctor/p/3781078.html 先从较浅的层面来说,Python的内存管理机制可以从三个方面来讲 (1)垃圾回收 (2)引用计数 (3)内存池机制 一.垃圾回收: python不像C++,Java等语言一样,他们可以不用事先声明变量类型而直接对变量进行赋值.对Python语言来讲,对象的类型和内存都是在运行时确定的.这也是为什么我们称Python语言为动态类型的原因(这里我们把动态类型可以简单的归结为对变量内存地址的分配是

centos7.0 安装日志--图文详解-python开发环境配置

centos7.0发布之后,就下载了everthing的DVD镜像,今天有时间,所以决定在vbox底下体验一番--- 上图: 默认是体验安装,作为一个忠实粉丝,我决定选择直接安装! 这个界面是这次新版本更新后改的,它把以前要下一步.上一步可以修改的操作全部集中到一个页面来,默认选择是下图这样,比如你想修改软件安装选项只要点击相应选项就可以了. 每次你更改安装选项之后,它都会自动从新计算安装源,如果你的选择的资源本地没有,还可以通过网络来安装,默认网络是不启用的,所以我们需要自己手工设置一下网络.

详解Python中re.sub--转载

[背景] Python中的正则表达式方面的功能,很强大. 其中就包括re.sub,实现正则的替换. 功能很强大,所以导致用法稍微有点复杂. 所以当遇到稍微复杂的用法时候,就容易犯错. 所以此处,总结一下,在使用re.sub的时候,需要注意的一些事情. 解释具体的注意事项之前,先把其具体的解释贴出来: re.sub re.sub(pattern, repl, string, count=0, flags=0) Return the string obtained by replacing the

Android内存管理机制详解 (zhuan)

http://www.2cto.com/kf/201212/175786.html 与windows内存区别 在Linux中经常发现空闲内存很少,似乎所有的内存都被系统占用了,表面感觉是内存不够用了,其实不然.这是Linux内存管理的一个优秀特性,在这方面,区别于 Windows的内存管理.主要特点是,无论物理内存有多大,Linux都将其充份利用,将一些程序调用过的硬盘数据读入内存,利用内存读写的高速特性来提高Linux系统的数据访问性能.而Windows是只在需要内存时,才为应用程序分配内存,

举例详解Python中的split()函数的使用方法

这篇文章主要介绍了举例详解Python中的split()函数的使用方法,split()函数的使用是Python学习当中的基础知识,通常用于将字符串切片并转换为列表,需要的朋友可以参考下 函数:split() Python中有split()和os.path.split()两个函数,具体作用如下:split():拆分字符串.通过指定分隔符对字符串进行切片,并返回分割后的字符串列表(list)os.path.split():按照路径将文件名和路径分割开 一.函数说明1.split()函数语法:str.

详解python的垃圾回收机制

python的垃圾回收机制 一.引子 我们定义变量会申请内存空间来存放变量的值,而内存的容量是有限的,当一个变量值没有用了(简称垃圾)就应该将其占用的内存空间给回收掉,而变量名是访问到变量值的唯一方式,所以当一个变量值没有关联任何变量名时,我们就无法再访问到该变量值了,该变量值就是一个垃圾会被python解释的垃圾回收机制自动回收 二.什么是垃圾回收机制 垃圾回收机制(简称GC)是python解释器自带的一种机制,专门用来回收不可用的变量值所占用的内存空间 三.为什么要用垃圾回收机制 程序运行过

memcached内存管理机制详解

    我们知道,memcached是一个内存缓存系统,因此对于内存的管理是需要使用者了解的.本文将对memcached的内存模型及管理机制做一个详细的描述. 基本概念 在开始之前,有必要先了解几个基本概念: 1.slab class:在memcached中,对元素的管理是以slab为单元进行管理的.每个slab class对应一个或多个空间大小相同的chunk.参考下图一. 2.chunk:存放元素的最小单元.用户数据item(key.value等)最终会保存在chunk中.memcach