C#引用类型详细剖析(转)

C#引用类型和值类型的区别——值类型和引用类型在内存中的部署

经常听说,并且经常在书上看到:值类型部署在栈上,引用类型部署在托管堆上。实际上并没有这么简单。

MSDN上说:托管堆上部署了所有引用类型。这很容易理解。当创建一个应用类型变量时:

  1. object reference = new object();

关键字new将在托管堆上分配内存空间,并返回一个该内存空间的地址。左边的reference位于栈上,是一个引用,存储着一个内存地址;而这个地址指向的内存(位于托管堆)里存储着其内容(一个System.Object的实例)。下面为了方便,简称引用类型部署在托管推上。

再来看值类型。《C#语言规范》上的措辞是“结构体不要求在堆上分配内存(However, unlike classes, structs are value types and do not require heap allocation)”而不是“结构体在栈上分配内存”。这不免容易让人感到困惑:值类型究竟部署在什么地方?

数组

考虑数组:

  1. int[] reference = new int[100];

根据定义,数组都是引用类型,所以int数组当然是引用类型(即reference.GetType().IsValueType为false)。

而int数组的元素都是int,根据定义,int是值类型(即reference[i].GetType().IsValueType为true)。那么引用类型数组中的值类型元素究竟位于栈还是堆?

如果用WinDbg去看reference[i]在内存中的具体位置,就会发现它们并不在栈上,而是在托管堆上。

实际上,对于数组:

  1. TestType[] testTypes = new TestType[100];

如果TestType是值类型,则会一次在托管堆上为100个值类型的元素分配存储空间,并自动初始化这100个元素,将这100个元素存储到这块内存里。

如果TestType是引用类型,则会先在托管堆为testTypes分配一次空间,并且这时不会自动初始化任何元素(即testTypes[i]均为null)。等到以后有代码初始化某个元素的时候,这个引用类型元素的存储空间才会被分配在托管堆上。

类型嵌套

更容易让人困惑的是引用类型包含值类型,以及值类型包含引用类型的情况:

  1. public class ReferenceTypeClass
  2. {
  3. private int _valueTypeField;
  4. public ReferenceTypeClass()
  5. {
  6. _valueTypeField = 0;
  7. }
  8. public void Method()
  9. {
  10. int valueTypeLocalVariable = 0;
  11. }
  12. }
  13. ReferenceTypeClass referenceTypeClassInstance = new ReferenceTypeClass();//Where is _valueTypeField?
  14. referenceTypeClassInstance.Method();//Where is valueTypeLocalVariable?
  15. public struct ValueTypeStruct
  16. {
  17. private object _referenceTypeField;
  18. public void Method()
  19. {
  20. _referenceTypeField = new object();
  21. object referenceTypeLocalVariable = new object();
  22. }
  23. }
  24. ValueTypeStruct valueTypeStructInstance = new ValueTypeStruct();
  25. valueTypeStructInstance.Method();//Where is _referenceTypeField?And where is referenceTypeLocalVariable?

单看valueTypeStructInstance,这是一个结构体实例,感觉似乎是整块扔到栈上的。但是字段_referenceTypeField是引用类型,局部变量referenceTypeLocalVarible也是引用类型。

referenceTypeClassInstance也有同样的问题,referenceTypeClassInstance本身是引用类型,似乎应该整块部署在托管堆上。但字段_valueTypeField是值类型,局部变量valueTypeLocalVariable也是值类型,它们究竟是在栈上还是在托管堆上?

规律是:

引用类型部署在托管堆上; 值类型总是分配在它声明的地方:作为字段时,跟随其所属的变量(实例)存储;作为局部变量时,存储在栈上。 我们来分析一下上面的代码。

对于引用类型实例,即referenceTypeClassInstance:

从上下文看,referenceTypeClassInstance是一个局部变量,所以部署在托管堆上,并被栈上的一个引用所持有; 值类型字段_valueTypeField属于引用类型实例referenceTypeClassInstance的一部分,所以跟随引用类型实例referenceTypeClassInstance部署在托管堆上(有点类似于数组的情形);

valueTypeLocalVariable是值类型局部变量,所以部署在栈上。

而对于值类型实例,即valueTypeStruct:

根据上下文,值类型实例valueTypeStructInstance本身是一个局部变量而不是字段,所以位于栈上; 其引用类型字段_referenceTypeField不存在跟随的问题,必然部署在托管堆上,并被一个引用所持有(该引用是valueTypeStruct的一部分,位于栈); 其引用类型局部变量referenceTypeLocalVariable显然部署在托管堆上,并被一个位于栈的引用所持有。 所以,简单地说“值类型存储在栈上,引用类型存储在托管堆上”是不对的。必须具体情况具体分析。

C#引用类型和值类型的区别——正确使用值类型和引用类型

这一部分主要参考《Effective C#》,并非本人原创,希望能让你加深对值类型和引用类型的理解。辨明值类型和引用类型的使用场合C#中,我们用struct/class来声明一个类型为值类型/引用类型。

考虑下面的例子:

  1. TestType[] testTypes = new TestType[100];

如果TestTye是值类型,则只需要一次分配,大小为TestTye的100倍。而如果TestTye是引用类型,刚开始需要100次分配,分配后数组的各元素值为null,然后再初始化100个元素,结果总共需要进行101次分配。这将消耗更多的时间,造成更多的内存碎片。所以,如果类型的职责主要是存储数据,值类型比较合适。

一般来说,值类型(不支持多态)适合存储供 C#应用程序操作的数据,而引用类型(支持多态)应该用于定义应用程序的行为。

通常我们创建的引用类型总是多于值类型。如果以下问题的回答都为yes,那么我们就应该创建为值类型:

该类型的主要职责是否用于数据存储? 该类型的共有借口是否完全由一些数据成员存取属性定义? 是否确信该类型永远不可能有子类? 是否确信该类型永远不可能具有多态行为? 将值类型尽可能实现为具有常量性和原子性的类型

具有常量性的类型很简单:

如果构造的时候验证了参数的有效性,之后就一直有效; 省去了许多错误检查,因为禁止更改; 确保线程安全,因为多个reader访问到同样的内容; 可以安全地暴露给外界,因为调用者不能更改对象的内部状态。 具有原子性的类型都是单一的实体,我们通常会直接替换一个原子类型的整个内容。

下面是一个典型的可变类型:

  1. public struct Address
  2. {
  3. private string _city;
  4. private string _province;
  5. private int _zipCode;
  6. public string City
  7. {
  8. get { return _city; }
  9. set { _city = value; }
  10. }
  11. public string Province
  12. {
  13. get { return _province; }
  14. set
  15. {
  16. ValidateProvince(value);
  17. _province = value;
  18. }
  19. }
  20. public int ZipCode
  21. {
  22. get { return _zipCode; }
  23. set
  24. {
  25. ValidateZipCode(value);
  26. _zipCode = value;
  27. }
  28. }
  29. }

下面创建一个实例:

  1. Address address = new Address();
  2. address.City = "Chengdu";
  3. address.Province = "Sichuan";
  4. address.ZipCode = 610000;

然后更改这个实例:

  1. address.City = "Nanjing"; //Now Province and ZipCode are invalid
  2. address.ZipCode = 210000; //Now Province is still invalid
  3. address.Province = "Jiangsu";

可见,内部状态的改变意味着可能违反对象的不变式(invariant),至少是临时的违反。如果上面是一个多线程的程序,那么在 City更改的过程中,另一个线程可能看到不一致的数据视图。如果不是多线程的程序,也有问题:

当ZipCode的值无效而抛出异常时,对象仅作了一部分改变,因此处于无效的状态,为了修复这个问题,需要在Address中添加相当多的内部校验代码;

为了实现异常安全,我们需要在所有改变多个字段的客户代码处放上防御性的代码;

线程安全也要求我们在每一个属性的访问器上添加线程同步检查。

显然,这是一个相当可观的工作量。下面我们把Address实现为常量类型:

  1. public struct Address
  2. {
  3. private string _city;
  4. private string _province;
  5. private int _zipCode;
  6. public Address (string city, string province, int zipCode)
  7. {
  8. _city = city;
  9. _province = province;
  10. _zipCode = zipCode;
  11. ValidateProvince(province);
  12. ValidateZipCode(zipCode);
  13. }
  14. public string City
  15. {
  16. get { return _city; }
  17. }
  18. public string Province
  19. {
  20. get { return _province; }
  21. }
  22. public int ZipCode
  23. {
  24. get { return _zipCode; }
  25. }
  26. }

如果要改变Address,不能修改现有的实例,只能创建一个新的实例:

  1. Address address = new Address("Chengdu", "Sichuan", 610000);//create a instance
  2. address = new Address("Nanjing", "Jiangsu", 210000);//modify the instance

address将不存在任何无效的临时状态。那些临时状态只存在于Address的构造函数执行过程中。这样一来,Address是异常安全的,也是线程安全的。

确保0为值类型的有效状态

.NET的默认初始化机制会将引用类型设置为二进制意义上的0,即null。而对于值类型,不论我们是否提供构造函数,都会有一个默认的构造函数,将其设置为0。

一种典型的情况是枚举:

  1. public enum Sex
  2. {
  3. Male = 1;
  4. Female = 2;
  5. }

然后用做值类型的成员:

  1. public struct Employee
  2. {
  3. private Sex _sex;
  4. //other
  5. }

创建Employee结构体将得到一个无效的Sex字段:

  1. Employee employee = new Employee ();

employee的_sex是无效的,因为其为0。我们应该将0作为一个为初始化的值明确表示出来:

  1. public Sex
  2. {
  3. None = 0;
  4. Male = 1;
  5. Female = 2;
  6. }

如果值类型中包含引用类型,会出现另一种初始化问题:

  1. public struct ErrorLog
  2. {
  3. private string _message;
  4. //other
  5. }

然后创建一个ErrorLog:

  1. ErrorLog errorLog = new ErrorLog ();

errorLog的_message字段将是一个空引用。我们应该通过一个属性来将_message暴露给客户代码,从而使该问题限定在ErrorLog 的内部:

  1. public struct ErrorLog
  2. {
  3. private string _message;
  4. public string Message
  5. {
  6. get
  7. {
  8. return (_message ! = null) ? _message : string.Empty;
  9. }
  10. set { _message = value; }
  11. }
  12. //other
  13. }

尽量减少装箱和拆箱

装箱指把一个值类型放入一个未具名类型的引用类型中,比如:

  1. int valueType = 0;
  2. object referenceType = i;//boxing

拆箱则是从前面的装箱对象中取出值类型:

  1. object referenceType;
  2. int valueType = (int)referenceType;//unboxing

装箱和拆箱是比较耗费性能的,还会引入一些诡异的bug,我们应当避免装箱和拆箱。

装箱和拆箱最大的问题是会自动发生。比如:

  1. Console.WriteLine("A few numbers: {0}, {1}.", 25, 32);

其中,Console.WriteLine()接收的参数类型是(string,object,object)。因此,实际上会执行以下操作:

  1. int i = 25;
  2. obeject o = i;//boxing

然后把o传给WriteLine()方法。在WriteLine()方法的内部,为了调用i上的ToString()方法,又会执行:

  1. int i = (int)o;//unboxing
  2. string output = i,ToString();

所以正确的做法应该是:

  1. Console.WriteLine("A few numbers: {0}, {1}.", 25.ToString(), 32.ToString());

25.ToString()只是执行一个方法并返回一个引用类型,不存在装箱/拆箱的问题。

另一个典型的例子是ArryList的使用:

  1. public struct Employee
  2. {
  3. private string _name;
  4. public Employee(string name)
  5. {
  6. _name = name;
  7. }
  8. public string Name
  9. {
  10. get { return _name; }
  11. set { _name = value; }
  12. }
  13. public override string ToString()
  14. {
  15. return _name;
  16. }
  17. }
  18. ArrayList employees = new ArrayList();
  19. employees.Add(new Employee("Old Name"));//boxing
  20. Employee ceo = (Employee)employees[0];//unboxing
  21. ceo.Name = "New Name";//employees[0].ToString() is still "Old Name"

上面的代码不仅存在性能的问题,还容易导致错误发生。

在这种情况下,更好的做法是使用泛型集合:

  1. List< Employee> employees = new List< Employee>();

由于List< T>是强类型的集合,employees.Add()方法不进行类型转换,所以不存在装箱/拆箱的问题。

C#引用类型和值类型的区别——总结

C#中,变量是值还是引用仅取决于其数据类型。

C#的值类型包括:结构体(数值类型,bool型,用户定义的结构体),枚举,可空类型。

C#的引用类型包括:数组,用户定义的类、接口、委托,object,字符串。

数组的元素,不管是引用类型还是值类型,都存储在托管堆上。

引用类型在栈中存储一个引用,其实际的存储位置位于托管堆。为了方便,本文简称引用类型部署在托管推上。

值类型总是分配在它声明的地方:作为字段时,跟随其所属的变量(实例)存储;作为局部变量时,存储在栈上。

值类型在内存管理方面具有更好的效率,并且不支持多态,适合用作存储数据的载体;引用类型支持多态,适合用于定义应用程序的行为。

应该尽可能地将值类型实现为具有常量性和原子性的类型。

应该尽可能地确保0为值类型的有效状态。

应该尽可能地减少装箱和拆箱。

关键字new将在托管堆上分配内存空间,并返回一个该内存空间的地址。左边的reference位于栈上,是一个引用,存储着一个内存地址;而这个地址指向的内存(位于托管堆)里存储着其内容(一个System.Object的实例)。

时间: 2024-09-29 23:04:05

C#引用类型详细剖析(转)的相关文章

Mahout机器学习平台之聚类算法详细剖析(含实例分析)

第一部分: 学习Mahout必须要知道的资料查找技能: 学会查官方帮助文档: 解压用于安装文件(mahout-distribution-0.6.tar.gz),找到如下位置,我将该文件解压到win7的G盘mahout文件夹下,路径如下所示: G:\mahout\mahout-distribution-0.6\docs 学会查源代码的注释文档: 方案一:用maven创建一个mahout的开发环境(我用的是win7,eclipse作为集成开发环境,之后在Maven Dependencies中找到相应

bash脚本编程详细剖析

bash脚本编程详细剖析          背景:bash脚本编程是Linux学习一个至关重要的部分,想完成一个脚本可能很简单:但是想让自己的脚本写的让人觉得心旷神怡实为不简单.bash是所有Linux发行版的几乎都有的,因此我们这里以bash脚本为例,讨论bash脚本的编写方法.对于bash脚本编程中一些比较重要的知识点,我这里也会给予案例演示. 一.脚本编程中前话: 我们都知道,bash脚本编程说白了就是命令的堆积.只不过这种堆积的方式不是杂乱无章的堆积,而是按照一定要求和格式的链接.这说明

React Native:使用 JavaScript 构建原生应用 详细剖析

数月前,Facebook 对外宣布了正在开发的 React Native 框架,这个框架允许你使用 JavaScript 开发原生的 iOS 应用——就在今天,Beta 版的仓库释出了! 基于 PhoneGap 使用 JavaScript 和 HTML5 开发 iOS 应用已经有好几年了,那 React Native 有什么牛的? React Native 真的很牛,让大家兴奋异常的主要原因有两点: 可以基于 React Native使用 JavaScript 编写应用逻辑,UI 则可以保持全是

Ajax详细剖析

概述 对于WEB应用程序:用户浏览器发送请求,服务器接收并处理请求,然后返回结果,往往返回就是字符串(HTML),浏览器将字符串(HTML)渲染并显示浏览器上. 1.传统的Web应用 一个简单操作需要重新加载全局数据 2.AJAX AJAX,Asynchronous JavaScript and XML (异步的JavaScript和XML),一种创建交互式网页应用的网页开发技术方案. 异步的JavaScript:使用 [JavaScript语言] 以及 相关[浏览器提供类库] 的功能向服务端发

mysql数据库事务详细剖析

在写之前交代一下背景吧! 做开发也好久了,没怎么整理过知识,现在剖析一下自己对数据库事务的认识,以前用sqlserver,现在转java后又用mysql.oracle.我这块就主要解释一下mysql数据库事务.其实好多内容适用于各种标准数据库! 直接就进入正文了! 不管是做啥都有理论知识,我在这块也介绍一下. 事务的特性 1.原子性(Atomicity):原子性是指事务是一个不可分割的工作单位,事务中的操作要么都发生,要么都不发生. 2.一致性(Consistency):在一个事务中,事务前后数

玩转Android之Activity详细剖析

林炳文Evankaka原创作品.转载请注明出处http://blog.csdn.net/evankaka 本文主讲了什么是Activity,它的生命周期,不对的操作,调用了什么函数.以及不同的Activity之间的跳转.数据传递等. Activity 是用户接口程序,原则上它会提供给用户一个交互式的接口功能.它是 android 应用程序的基本功能单元.Activity 本身是没有界面的.所以activity类创建了一个窗口,开发人员可以通过setContentView(View)接口把UI放到

Cisco系列:Easy-VPN详细剖析(路由器、防火墙)

小生博客:http://xsboke.blog.51cto.com 小生 Q Q:1770058260 -------谢谢您的参考,如有疑问,欢迎交流 一. EASY-VPN简介 Ipsecvpn实现站点到站点的VPN Easyvpn实现远程VPN 1. Easy-vpn面临的问题 1)因为整个ipsec VPN加密传输的根本就是事先配置在设备上的预共享秘钥,一旦秘钥外泄,整个ipsec VPN所作的努力全都会付之东流 2)建立L2L IPSEC VPN时,双方都有固定的ip地址,这样我们才有可

mysql5.7:mysql安装和基于SSL加密的主从复制(详细剖析)

小生博客:http://xsboke.blog.51cto.com 小生 Q Q:1770058260 -------谢谢您的参考,如有疑问,欢迎交流 目录: --------mysql-5.7.13简介及安装 --------配置mysql-5.7.13的ssl加密传输 --------基于SSL加密传输实现mysql-5.7.13的主从复制 一. Mysql5.7.13简介 1. Mysql5.7的主要优化 mysql5.7原生支持centos7.*版本的systemd 更好的性能:对于多核

详细剖析电脑hosts文件的作用和修改

提到电脑系统中的hosts文件,如果不是太熟悉的话,还真是闻所未闻,一是由于系统的hosts文件为系统属性,在系统默认设置下,我们根本无法看到它的存在,而是由于身处系统深层文件夹内,我们一般也无法察觉到它的存在.下面就来说一下系统hosts文件的一些实用应用和修改. 一.hosts文件具体存放在哪 电脑系统hosts文件位于系统安装目录如Windows下的System32\Drivers\Etc 文件夹下(Windows 2000/XP/Vista/Seven系统),而在Windows 98系统