C++ 中new

operator new在C++中的各种写法

(2011-09-21 14:59:33)

标签:

杂谈

 

乍一看,在C++中动态分配内存很简单:new是分配,delete是释放,就这么简单。然而,这篇文章讲得要复杂一点,并且要考虑到自定义层次。这也许对简单的程序并不重要,但对你在代码中控制内存却是十分必要的,是否能写一个自定义的分配器,某种高级内存管理表或一个特定的垃圾回收机制。

这篇文章并不是一个综合的手册,而是一个C++中各种内存分配方法的概述。它面向已经很熟悉C++语言的读者。

原生operator new

我们先从原生operator new开始。考虑如下代码,它用来分配5个int型的空间并返回指向他们的指针[1]

int* v = static_cast<int*>(::operator new(5 * sizeof(*v)));

当像如上的调用,operator new扮演原生的内存分配角色,类似malloc。上面等价于:

int* v = static_cast<int*>(malloc(5 * sizeof(*v)));

释放用operator new分配的内存用operator delete:

::operator delete(v);

你愿意永远用原生new和delete函数吗?是,只在极少数不用,我在下面的文章中会论证的。为什么用它们而不用原来的可信的malloc和free呢?一个很充分的原因就是你想保持代码在C++领域的完整性。混合使用new和free(或malloc和delete)是很不可取的(big NO NO)。用new和delete的另一个原因是你可以重载(overload)或重写(override)这些函数,只要你需要。下面是个例子:

voidoperator new(size_t sz) throw (std::bad_alloc)

{

cerr << "allocating " << sz << " bytesn";

void* mem = malloc(sz);

if (mem)

return mem;

else

throw std::bad_alloc();

}

void operator delete(void* ptr) throw()

{

cerr << "deallocating at " << ptr << endl;

free(ptr);

}

通常,注意到new被用来给内置类型,不包含用户自定义new函数的类的对象,和任意类型的数组分配空间,使用的都是全局的运算符new。当new被用来为已经被重定义new的类实例化时,用的就是那个类的new函数。

下面来看下带new函数的类。

特定类的operator new

大家有时很好奇"operator new"和"new operator"的区别。前者可以是一个重载的operator new,全局的或者特定类或者原生的operator new。后者是你经常用来分配内存的C++内置的new operator,就像:

Car* mycar = new Car;

C++支持操作符重载,并且我们可以重载的其中一个就是new。

下面是个例子:

class Base

{

public:

voidoperator new(size_t sz)

{

cerr << "new " << sz << " bytesn";

return ::operator new(sz);

}

void operator delete(void* p)

{

cerr << "deleten";

::operator delete(p);

}

private:

int m_data;

};

class Derived : public Base

{

private:

int m_derived_data;

vector<int> z, y, x, w;

};

int main()

{

Base* b = new Base;

delete b;

Derived* d = new Derived;

delete d;

return 0;

}

打印结果:

new 4 bytes

delete

new 56 bytes

delete

在基类被重载的operator new和operator delete也同样被子类继承。如你所见,operator new得到了两个类的正确大小。注意实际分配内存时使用了::operator new,这是前面所描述过的原生new。在调用前面的两个冒号很关键,是为了避免进行无限递归(没有它函数将一直调用自己下去)。

为什么你要为一个类重载operator new?这里有许多理由。

性能:默认的内存分配算符被设计成通用的。有时你想分配给一个非常特殊的对象,通过自定义分配方式可以明显地提高内存管理。许多书和文章都讨论了这种情况。尤其是"Modern C++ Design"的第4章展示了一个为较小的对象的非常好的设计并实现了自定义的分配算符。

调试 & 统计:完全掌握内存的分配和释放为调试提供了很好的灵活性,统计信息和性能分析。你可将你的分配算符插入进专门用来探测缓冲区溢出的守卫,通过分配算符和释放算符(deallocations)的比较来检测内存泄漏,为统计和性能分析积累各种指标,等等。

个性化:对于非标准的内存分配方式。一个很好的例子是内存池或arenas,它们都使得内存管理变得更简单。另一个例子是某个对象的完善的垃圾回收系统,可以通过为一个类或整个层面写你自己的operators new和delete。

研究在C++中new运算符是很有帮助的。分配是分两步进行:

1.  首先,用全局operator new指导系统请求原生内存。

2.  一旦请求内存被分配,一个新的对象就在其中开始构造。

The C++ FAQ给出一个很好的例子,我很愿意在这里这出来:

当你写下这段代码:

Foo* p = new Foo();

编译器会生成类似这种功能的代码:

Foo* p;

// don‘t catch exceptions thrown by the allocator itself

//不用捕捉分配器自己抛出的异常

void* raw = operator new(sizeof(Foo));

// catch any exceptions thrown by the ctor

//捕捉ctor抛出的任何异常

try {

p = new(raw) Foo();  // call the ctor with raw as this 像这样用raw调用ctor分配内存

}

catch (...)
{

// oops, ctor threw an exception 啊哦,ctor抛出了异常

operator delete(raw);

throw;  // rethrow the ctor‘s exception 重新抛出ctor的异常

}

其中在try中很有趣的一段语法被称为"placement new",我们马上就会讨论到。为了使讨论完整,我们来看下用delete来释放一个对象时一个相似的情况,它也是分两步进行:

1.  首先,将要被删除对象的析构函数被调用。

2.  然后,被对象占用的内存通过全局operator delete函数返还给系统。

所以:

delete p;

等价于[2]:

if (p != NULL)
{

p->~Foo();

operator delete(p);

}

这时正适合我重复这篇文章第一段提到的,如果一个类有它自己的operator new或 operator delete,这些函数将被调用,而不是调用全局的函数来分配和收回内存。

Placement new

现在,回来我们上面看到样例代码中的"placement new"问题。它恰好真的能用在C++代码中的语法。首先,我想简单地解释它如何工作。然后,我们将看到它在什么时候有用。

直接调用 placement new会跳过对象分配的第一步。也就是说我们不会向操作系统请求内存。而是告诉它有一块内存用来构造对象[3]。下面的代码表明了这点:

int main(int argc, const char* argv[])

{

// A "normal" allocation. Asks the OS for memory, so we

// don‘t actually know where this ends up pointing.

//一个正常的分配。向操作系统请求内存,所以我们并不知道它指向哪里

int* iptr = new int;

cerr << "Addr of iptr =
" << iptr << endl;

// Create a buffer large enough to hold an integer, and

// note its address.

//创建一块足够大的缓冲区来保存一个整型,请注意它的地址

char mem[sizeof(int)];

cerr << "Addr of mem =
" <<
(void*) mem << endl;

// Construct the new integer inside the buffer ‘mem‘.

// The address is going to be mem‘s.

//在缓冲区mem中构造新的整型,地址将变成mem的地址

int*
iptr2 = new (mem) int;

cerr << "Addr of iptr2
= " << iptr2
<< endl;

return 0;

}

在我的机器上输出如下:

Addr of iptr =
0x8679008

Addr of mem =
0xbfdd73d8

Addr of iptr2 =
0xbfdd73d8

如你所见,placement new的结构很简单。而有趣的问题是,为什么我需要用这种东西?以下显示了placement new在一些场景确实很有用:

·         自定义非侵入式内存管理。当为一个类重载 operator new 同时也允许自定义内存管理,这里关键概念是非侵入式。重载一个类的 operator new需要你改变一个类的源代码。但假设我们有一个类的代码不想或者不能更改。我们如何仍能控制它的分配呢? Placement new就是答案。这种用 Placement new达到这个目的的通用编程技术叫做内存池,有时候也叫arenas[4]

·         在一些程序中,在指定内存区域的分配对象是很必要的。一个例子是共享内存。另一个例子是嵌入式程序或使用内存映射的周边驱动程序,这些都可以很方便地在它们的“领地”分配对象。

·         许多容器库预先分配很大一块内存空间。当一个对象被添加,它们就必须在这里构造,因此就用上了placement new。典型的例子就是标准vector容器。

删除用placement new 分配的对象

一条C++箴言就是一个用new创建的对象应该用delete来释放。这个对placement new 同样适用吗?不完全是:

int main(int argc, const char* argv[])

{

char mem[sizeof(int)];

int*
iptr2 = new (mem) int;

delete iptr2;       // Whoops, segmentation fault! 呜啊,段错误啦!

return 0;

}

为了理解上面代码片段为什么delete iptr2会引起段错误(或某种内存异常,这个因操作系统而异),让我们回想下delete iptr2实际干了什么:

1.  First, the destructor of the object that’s being deleted is called.

首先,调用将要被删除的对象的析构函数。

2.  Then, the memory occupied by the object is returned to the OS, represented by the global operator delete function.

然后,这个对象在操作系统中占用的内存用全局operator delete函数收回。

对于用placement new分配的对象,第一步是没有问题的,但第二步就可疑了。尝试释放一段没有被分配算符实际分配的内存就不对了,但上面的代码确实这么做了。iptr2指向了一段并没有用全局operator new分配的栈中的一段位置。然而,delete iptr2将尝试用全局operator delete来释放内存。当然会段错误啦。

那么我们应该怎么办?我们应该怎样正确地删除iptr2?当然,我们肯定不会认为编译器怎么会解决怎么翻译内存,毕竟,我们只是传了一个指针给placement new,那个指针可能是从栈里拿,从内存池里或者别的地方。所以必须手动根据实际情况来释放。

事实上,上面的placement new用法只是C++的new指定额外参数的广义placement new语法的一种特例。它在标准头文件中定义如下:

inline voidoperator new(std::size_t, void*
__p) throw()

{

return __p;

}

C++一个对应的带有相同参数的delete也被找到,它用来释放一个对象。它在头文件中定义如下:

inline void  operator delete  (void*, void*) throw()

{

}

的确,C++运行并不知道怎么释放一个对象,所以delete函数没有操作。

怎么析构呢?对于一个int,并不真的需要一个析构函数,但假设代码是这样的:

char mem[sizeof(Foo)];

Foo* fooptr = new (mem) Foo;

对于某个有意义的类Foo。我们一旦不需要fooptr了,应该怎么析构它呢?我们必须显式调用它的析构函数:

fooptr->~Foo();

对,显式调用析构函数在C++中是合法的,并且这也是唯一一种正确的做法[5]

结论

这是一个复杂的主题,并且这篇文章只起到一个介绍的作用,对C++的多种内存分配方法给出了一种“尝鲜”。一旦你研究一些细节会发现还有许多有趣的编程技巧(例如,实现一个内存池分配)。这些问题最好是在有上下文的情况下提出,而不是作为一个普通的介绍性文章的一部分。如果你想知道得更多,请查阅下面的资源列表。

资源

·         C++ FAQ Lite, especially items 11.14 and 16.9

·         "The C++ Programming Language,
3rd edition" by Bjarne Stroustrup – 10.4.11

·         "Effective C++,
3rd edition" by Scott Myers – item 52

·         "Modern C++ Design" by Andrei Alexandrescu – chapter 4

·         Several StackOverflow discussions. Start with this one and browse as long as your patience lasts.


[1]


我仍会在operator new前面显式地写::(双冒号),虽然这里并不是必须的。恕我直言,这是一个很好的做法,特别当在重载operator new的类中,可以避免二义性。


[2]


注意到这里是检查是否为NULL。这样做使delete p 很安全,即使p是NULL。


[3]


对传给placement new的指针确保有足够的内存分配给对象,并且确保它们正确地对齐,这都是你的应该做的。


[4]


内存池本身是一个很大且迷人的话题。我并不打算在这里扩展,所以我鼓励你自己上网找些信息,WIKI如往常一样是个好地方(good start)。


[5]


事实上,标准的vector容器用这种方法去析构它保存的数据。

时间: 2024-11-06 13:33:18

C++ 中new的相关文章

win10周年版eNSP中启动AR提示错误代码40问题

win 10操作系统中安装eNSP 1.2.00.380,一直运行正常,但在2016年11月升级win 周年版之后,启动AR时启动失败,提示错误代码40. 卸载eNSP及VirtualBox之后重装问题依旧.按照论坛和网上各种说法更新virtualbox修改虚拟网卡设置,或者重新注册都无法解决,最终多方查找终于找到解决方案. 环境:win10 周年版,eNSP 1.2.00.380,VirtualBox 4.2.8 eNSP注册后virtualbox管理器中会出现AR_Base,WLAN_AC_

css中的px、em、rem 详解

概念介绍: 1.px (pixel,像素):是一个虚拟长度单位,是计算机系统的数字化图像长度单位,如果px要换算成物理长度,需要指定精度DPI(Dots Per Inch,每英寸像素数),在扫描打印时一般都有DPI可选.Windows系统默认是96dpi,Apple系统默认是72dpi. 2.em(相对长度单位,相对于当前对象内文本的字体尺寸):是一个相对长度单位,最初是指字母M的宽度,故名em.现指的是字符宽度的倍数,用法类似百分比,如:0.8em, 1.2em,2em等.通常1em=16px

angularJs中关于ng-class的三种使用方式说明

在开发中我们通常会遇到一种需求:一个元素在不同的状态需要展现不同的样子. 而在这所谓的样子当然就是改变其css的属性,而实现能动态的改变其属性值,必然只能是更换其class属性 这里有三种方法: 第一种:通过数据的双向绑定(不推荐) 第二种:通过对象数组 第三种:通过key/value 下面简单说下这三种: 第一种:通过数据的双向绑定 实现方式: function changeClass(){   $scope.className = "change2"; } <div clas

Uploadify/uploadifive上传(中文文档)

Uploadify是一款基于JQuery的优秀的文件/图片上传的插件,有基于Flash和HTML5两种版本. Uploadify/uploadifive主要特点有: 1. 多文件上传 2. 个性化设置 3. 上传进度条显示 4. 拖拽上传(HTML5版本) 官网:http://www.uploadify.com 部署 在部署一个Uploadify实例前,请确保满足最低要求: 1.jQuery 1.4.x 或更高版本 2.Flash Player 9.0.24 或更高版本 3.支持PHP, ASP

XShell 连接虚拟机中的服务器 失败 、连接中断(Connection closed by foreign host.)

在使用XShell连接虚拟机中的服务器时,报以下错误并断开连接,之前连接还是挺稳定的,忽然就这样了 Last login: Thu Aug 10 21:28:38 2017 from 192.168.1.102 [[email protected] ~]# Socket error Event: 32 Error: 10053. Connection closing...Socket close. Connection closed by foreign host. Disconnected f

微信浏览器中调用支付宝支付

众所周知,在微信浏览器中是无法唤起支付宝的,会提示请在浏览器中打开,如果非要在微信浏览器中调起支付宝的话,只能是跳出微信浏览器,关于这一点,在支付宝官网给出了一个例子.但是,话说回去,后来我仔细想想,其实真的没有必要非要在微信浏览器中调起支付宝支付(当时真是一根筋啊啊啊...) 支付宝手机网站支付的官方文档: https://doc.open.alipay.com/docs/doc.htm?treeId=203&articleId=105288&docType=1 快速接入: https:

C#中Dictionary的介绍

关键字:C# Dictionary 字典 作者:txw1958原文:http://www.cnblogs.com/txw1958/archive/2012/11/07/csharp-dictionary.html 说明    必须包含名空间System.Collection.Generic     Dictionary里面的每一个元素都是一个键值对(由二个元素组成:键和值)     键必须是唯一的,而值不需要唯一的     键和值都可以是任何类型(比如:string, int, 自定义类型,等等

C#中使用ffmpeg合并视频

首先将最新的ffmpeg.exe放到debug路径下,下载地址 http://www.ffmpeg.org/download.html 然后调用此方法 public void CombineMp4WithoutTxt(string StrMP4A, string StrMP4B, string StrOutMp4Path) { Process p = new Process();//建立外部调用线程 p.StartInfo.FileName = System.Windows.Forms.Appl

Javascript中call的使用

call 方法应用于:Function 对象调用一个对象的一个方法,以另一个对象替换当前对象.call([thisObj[,arg1[, arg2[,   [,.argN]]]]])参数:thisObj 可选项.将被用作当前对象的对象. arg1, arg2, , argN 可选项.将被传递方法参数序列. 说明:call 方法可以用来代替另一个对象调用一个方法.call 方法可将一个函数的对象上下文从初始的上下文改变为由 thisObj 指定的新对象.如果没有提供 thisObj 参数,那么 G

微信公众号中添加外部链接地址的图文教程

2017-9-18,长沙,有点闷,有点热. 本教程教大家如何在微信公众号中,添加外部的链接,网络有很多教程,但由于表述不太清楚,出个教程吧.最终实现在微信后台管理平台"原文链接"处插入外部链接,用户点击发布好的图文文章底部左下角的"阅读原文",就可以跳转到您添加的外部链接页面中去. 第1步. 使用微信公众管理帐号登陆微信管理后台 > 素材管理 > 图文消息 >  新建图文消息或者编辑文章都可以,如下图所示: 第2步. 之后,将页面向下拉,看到底部&