C++ 多继承和虚继承的内存布局(Memory Layout for Multiple and Virtual Inheritance)

警告. 本文有点技术难度,需要读者了解C++和一些汇编语言知识。

在本文中,我们解释由gcc编译器实现多继承和虚继承的对象的布局。虽然在理想的C++程序中不需要知道这些编译器内部细节,但不幸的是多重继承(特别是虚拟继承)的实现方式有各种各样的不太明确的结论(尤其是,关于向下转型指针,使用指向指针的指针,还有虚拟基类的构造方法的调用命令)。
如果你了解多重继承是如何实现的,你就能预见到这些结论并运用到你的代码中。而且,如果你关心性能,理解虚拟继承的开销也是非常有用的。最后,这很有趣。 :-)

多重继承

classTop

publicinta;

}; classLeft
publicTop

publicintb;

}; classRight
publicTop

publicintc;

}; classBottom
publicLeft, publicRight

publicintd;

};

使用UML图,我们可以把这个层次结构表示为:

注意Top被继承了两次(在Eiffel语言中这被称作重复继承)。这意味着类型Bottom的一个实例bottom将有两个叫做a的元素(分别为bottom.Left::a和bottom.Right::a)。

Left、Right和Bottom在内存中是如何布局的?让我们先看一个简单的例子。Left和Right拥有如下的结构:

Left
Top::a
Left::b
   Right
    Top::a
    Right::c

请注意第一个属性是从Top继承下来的。这意味着在下面两条语句后

?


1

2

Left*
left = <b>
new</b>
Left();

Top*
top = left;

left和top指向了同一地址,我们可以把Left Object当成Top Object来使用(很明显,Right与此也类似)。那Buttom呢?GCC的建议如下:

Bottom        
Left::Top::a
Left::b
Right::Top::a
Right::c
Bottom::d

如果我们提升Bottom指针,会发生什么事呢?

?


1

2

Bottom*
bottom = <b>
new</b>
Bottom();

Left*
left = bottom;

这段代码工作正常。我们可以把一个Bottom的对象当作一个Left对象来使用,因为两个类的内存部局是一样的。那么,如果将其提升为Right呢?会发生什么事?

?


1

Right*
right = bottom;

为了执行这条语句,我们需要判断指针的值以便让它指向Bottom中对应的段。

Bottom
Left::Top::a
Left::b
right  Right::Top::a
Right::c
Bottom::d

经过这一步,我们可以像操作正常Right对象一样使用right指针访问bottom。虽然,bottom与right现在指向两个不同的内存地址。出于完整性的缘故,思考一下执行下面这条语句时会出现什么状况。

?


1

Top*
top = bottom;

是的,什么也没有。这条语句是有歧义的:编译器将会报错。

?


1

error:
`Top

is an ambiguous base of `Bottom‘

两种方式可以避免这样的歧义

?


1

2

Top*
topL = (Left*) bottom;

Top*
topR = (Right*) bottom;

执行这两条语句后,topL和left会指向同样的地址,topR和right也会指向同样的地址。

 

虚拟继承

为了避免重复继承Top,我们必须虚拟继承Top:

?


1

2

3

4

5

6

7

8

9

classTop

publicinta;

}; classLeft
virtualpublicTop

publicintb;

}; classRight
virtualpublicTop

publicintc;

}; classBottom
publicLeft, publicRight

publicintd;

};

这就得到了如下的层次结构(也许是你一开始就想得到的)

虽然从程序员的角度看,这也许更加的明显和简便,但从编译器的角度看,这就变得非常的复杂。重新考虑下Bottom的布局,其中的一个(也许没有)可能是:

Bottom

Left::Top::a

Left::b

Right::c

Bottom::d

这个布局的优点是,布局的第一部分与Left的布局重叠了,这样我们就可以很容易的通过一个Left指针访问 Bottom类。可是我们怎么处理

?


1

Right*
right = bottom;

我们将哪个地址赋给right呢? 经过这个赋值,如果right是指向一个普通的Right对象,我们应该就能使用 right了。但是这是不可能的!Right本身的内存布局是完全不同的,这样我们就无法像访问一个"真正的"Right对象一样,来访问升级的Bottom对象。而且,也没有其它(简单的)可以正常运作的Bottom布局。

解决办法是复杂的。我们先给出解决方案,之后再来解释它。

你应该注意到了这个图中的两个地方。第一,字段的顺序是完全不同的(事实上,差不多是相反的)。第二,有几个vptr指针。这些属性是由编译器根据需要自动插入的(使用虚拟继承,或者使用虚拟函数的时候)。编译器也在构造器中插入了代码,来初始化这些指针。

vptr (virtual pointers)指向一个 “虚拟表”。类的每个虚拟基类都有一个vptr指针。要想知道这个虚拟表 (vtable)是怎样运用的,看看下面的C++ 代码。

?


1

2

Bottom*
bottom = <b>
new</b>
Bottom();

Left*
left = bottom; <b>
int</b>
p = left->a;

第二个赋值使left指向了bottom的所在地址(即,它指向了Bottom对象的“顶部”)。我们想想最后一条赋值语句的编译情况(稍微简化了):

?


1

2

3

4

5

6

movl
left, %eax # %eax = left

movl
(%eax), %eax # %eax = left.vptr.Left

movl
(%eax), %eax # %eax = 
virtualbase
offset

addl
left, %eax # %eax = left + 
virtualbase
offset

movl
(%eax), %eax # %eax = left.a

movl
%eax, p # p = left.a

用语言来描述的话,就是我们用left指向虚拟表,并且由它获得了“虚拟基类偏移”(vbase)。这个偏移之后就加到了left,然后left就用来指向Bottom对象的Top部分。从这张图你可以看到Left的虚拟基类偏移是20;如果假设Bottom中的所有字段都是4个字节,那么给left加上20字节将会确实指向a字段。

 

经过这个设置,我们就可以同样的方法访问Right部分。按这样

?


1

2

Bottom*
bottom = <b>
new</b>
Bottom();

Right*
right = bottom; <b>
int</b>
p = right->a;

之后right将指向Bottom对象的合适的部位:

Bottom
vptr.Left
Left::b
right  vptr.Right
Right::c
Bottom::d
Top::a

对top的赋值现在可以编译成像前面Left同样的方式。唯一的不同就是现在的vptr是指向了虚拟表的不同部位:取得的虚拟表偏移是12,这完全正确(确定!)。我们可以将其图示概括:

当然,这个例子的目的就是要像访问真正Right对象一样访问升级的Bottom对象。因此,我们必须也要给Right(和Left)布局引入vptrs:

现在我们就可以通过一个Right指针,一点也不费事的访问Bottom对象了。不过,这是付出了相当大的代价:我们要引入虚拟表,类需要扩展一个或更多个虚拟指针,对一个对象的一个简单属性的查询现在需要两次间接的通过虚拟表(即使编译器某种程度上可以减小这个代价)。

向下转换

如我们所见,将一个派生类的指针转换为一个父类的指针(或者说,向上转换)可能涉及到给指针增添一个偏移。有人可能会想了,这样向下转换(反方向的)就可以简单的通过减去同样的偏移来实现。确实,对非虚拟继承来说是这样的。可是,虚拟继承(毫不奇怪的!)带来了另一种复杂性。

假设我们像下面这个类这样扩展继承层次。

?


1

2

3

classAnotherBottom
publicLeft, publicRight

publicinte; intf;

};

继承层次现在看起来是这样

现在考虑一下下面的代码。

?


1

2

3

4

5

Bottom*
bottom1 = 
newBottom();

AnotherBottom*
bottom2 = 
newAnotherBottom();

Top*
top1 = bottom1;

Top*
top2 = bottom2;

Left*
left = 
static_cast<Left*>(top1);

下图显示了Bottom和AnotherBottom的布局,而且在最后一个赋值后面显示了指向top的指针。

Bottom
vptr.Left
Left::b
vptr.Right
Right::c
Bottom::d
top1  Top::a
AnotherBottom
vptr.Left
Left::b
vptr.Right
Right::c
AnotherBottom::e
AnotherBottom::f
top2  Top::a

现在考虑一下怎么去实现从top1到left的静态转换,同时要想到,我们并不知道top1是否指向一个Bottom类型的对象,或者是指向一个AnotherBottom类型的对象。所以这办不到!这个重要的偏移依赖于top1运行时的类型(Bottom则20,AnotherBottom则24)。编译器将报错:

?


1

2

error:
cannot convert from base `Top

to derived type `Left‘

via virtualbase
`Top‘

因为我们需要运行时的信息,所以应该用一个动态转换来替代实现:

?


1

Left*
left = <b>
dynamic_cast<</b>Left*<b>></b>(top1);

可是,编译器仍然不满意:

?


1

2

error:
cannot 
dynamic_cast`top
(of type `class Top*‘
)
to type

   `classLeft*‘
(source type is not polymorphic)

(注:polymorphic多态的)

问题在于,动态转换(转换中使用到typeid)需要top1所指向对象的运行时类型信息。但是,如果你看看这张图,你就会发现,在top1指向的位置,我们仅仅只有一个integer (a)而已。编译器没有包含指向Top的虚拟指针,因为它不认为这是必需的。为了强制编译器包含进这个vptr指针,我们可以给Top增加一个虚拟的析构器:

?


1

2

3

<b>class</b>
Top

{
<b>
public</b>:
<span><b>
virtual</b>
~Top() {}</span> <b>
int</b>
a;

};

这个修改需要指向Top的vptr指针。Bottom的新布局是

(当然类似的其它类也有一个新的指向Top的vptr指针)。现在编译器为动态转换插进了一个库调用:

?


1

left
= __dynamic_cast(top1, typeinfo_for_Top, typeinfo_for_Left, -1);

这个函数__dynamic_cast定义在stdc++库中(相应的头文件是cxxabi.h);参数为Top的类型信息,Left和Bottom(通过vptr.Top),这个转换可以执行。 (参数 -1 标示出Left和Top之间的关系现在还是未知)。更多详细资料,请参考tinfo.cc 的具体实现

总结语

最后,我们来看看一些没了结的部分。

指针的指针

这里出现了一点令人迷惑的问题,但是如果你仔细思考下一的话它其实很简单。我们来看一个例子。假设使用上一节用到的类层次结构(向下类型转换).在前面的小节我们已经看到了它的结果:

?


1

2

Bottom*
b = <b>
new</b>
Bottom();

Right*
r = b;

(在将b的值赋给r之前,需要将它调整8个字节,从而让它指向Bottom对象的Right部分).因此,我们可以合法地将一个Bottom* 赋值给一个Right*的指针。但是Bottom**和Right**又会怎样呢?

?


1

2

Bottom**
bb = &b;

Right**
rr = bb;

编译器会接受这样的形式吗?我们快速测试一下,编译器会报错:

?


1

error:
invalid conversion from `Bottom**

to `Right**‘

为什么呢?假设编译器可以接受从bb到rr的赋值。我们可以只管的看到结果如下:

?


1

<img
alt=
"double
pointers"

src=
"http://static.oschina.net/uploads/img/201309/25161720_1KNi.png">

因此,bb和rr都指向b,并且b和r指向Bottom对象的正确的章节。现在考虑当我们赋值给*rr时会发生什么(注意*rr的类型时Right*,因此这个赋值是有效的):

?


1

*rr
= b;   

这样的赋值和上面的赋值给r在根本上是一致的。因此,编译器会用同样的方式实现它!特别地,它会在赋值给*rr之前将b的值调整8个字节。办事*rr指向的是b!我们再一次图示化这个结果:

只要我们通过*rr来访问Bottom对象这都是正确的,但是只要我们通过b自身来访问它,所有的内存引用都会有8个字节的偏移---明显这是个不理想的情况。

因此,总的来说,及时*a 和*b通过一些子类型相关,**aa和**bb却是不相关的。

虚拟基类的构造函数

编译器必须确保对象的所有虚指针都被正确的初始化。特别是,编译器确保了类的所有虚基类都被调用,并且只被调用一次。如果你不显示地调用虚拟超类(不管他们在继承层次结构中的距离有多远),编译器都会自动地插入调用他们缺省构造函数。

这样也会引来一些不可以预期的错误。以上面给出的类层次结构作为示例,并添加上构造函数的部分:

?


1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

17

18

19

20

<b>class</b>
Top

{
<b>
public</b>:

   Top()
{ a = -1; }

   Top(<b>int</b>
_a) { a = _a; } <b>
int</b>
a;

};
<b>
class</b>
Left : <b>
public</b>
Top

{
<b>
public</b>:

   Left()
{ b = -2; }

   Left(<b>int</b>
_a, <b>
int</b>
_b) : Top(_a) { b = _b; } <b>
int</b>
b;

};
<b>
class</b>
Right : <b>
public</b>
Top

{
<b>
public</b>:

   Right()
{ c = -3; }

   Right(<b>int</b>
_a, <b>
int</b>
_c) : Top(_a) { c = _c; } <b>
int</b>
c;

};
<b>
class</b>
Bottom : <b>
public</b>
Left, <b>
public</b>
Right

{
<b>
public</b>:

   Bottom()
{ d = -4; }

   Bottom(<b>int</b>
_a, <b>
int</b>
_b, <b>
int</b>
_c, <b>
int</b>
_d) : Left(_a, _b), Right(_a, _c)

    {

      d
= _d;

    }
<b>
int</b>
d;

};

(首先考虑非虚拟的情况。)你会期望下面的代码段输出什么:

?


1

2

3

Bottom
bottom(1,2,3,4);

printf("%d
%d %d %d %d\n"
,
bottom.Left::a, bottom.Right::a,

   bottom.b,
bottom.c, bottom.d);

你可能会希望得到下面的结果,并且也得到了下面的结果:

?


1

1
1 2 3 4

然而,现在考虑虚拟的情况(我们虚拟继承自Top类)。如果我们仅仅做那样一个改变,并再一次运行程序,我们会得到:

?


1

-1
-1 2 3 4

为什么呢?通过跟踪构造函数的执行,会发现:

?


1

2

3

4

Top::Top()

Left::Left(1,2)

Right::Right(1,3)

Bottom::Bottom(1,2,3,4)

就像上面解释的一样,编译器在Bottom类执行其他构造函数之前中插入调用了缺省构造函数。 然后,当Left去调用它自身的超类的构造函数时(Top),我们会发现Top已经被初始化了因此构造函数不会被调用。

为了避免这种情况,你应该显示的调用虚基类的构造函数:

?


1

2

3

4

Bottom(int_a, int_b, int_c, int_d):
Top(_a), Left(_a,_b), Right(_a,_c)

{

   d
= _d;

}

指针等价

再假设同样的(虚拟)类继承等级,你希望这样就打印“相等”吗?

?


1

2

3

Bottom*
b = 
newBottom();

Right*
r = b; 
if(r
== b)

   printf("Equal!\n");

记住这两个地址并不实际相等(r偏移了8个字节)。但是这应该对用户完全透明;因此,实际上编译器在r与b比较之前,就给r减去了8个字节;这样,这两个地址就被认为是相等的了。

 

转换为void类型的指针

最后,我们来思考一下当将一个对象转换为void类型的指针时会发生什么事情。编译器必须保证一个指针转换为void类型的指针时指向对象的顶部。使用虚函数表这很容易实现。你可能已经想到了指向top域的偏移量是什么。它是虚函数指针到对象顶部的偏移量。因此,转化为void类型的指针操作可以使用查询虚函数表的方式来实现。然而一定要确保使用动态类型转换,如下:

dynamic_cast<void*>(b);

时间: 2024-08-06 01:26:41

C++ 多继承和虚继承的内存布局(Memory Layout for Multiple and Virtual Inheritance)的相关文章

转载:C++ 多继承和虚继承的内存布局

C++ 多继承和虚继承的内存布局[已翻译100%] 英文原文:Memory Layout for Multiple and Virtual Inheritance 标签: <无> run_mei 推荐于 4年前 (共 14 段, 翻译完成于 10-17) 评论 46 分享 收藏 198 参与翻译 (5人) : super0555, polarisxxm, Ley, zaobao, 开源中国吹牛第一仅中文 | 中英文对照 | 仅英文 | 打印此文章 警告. 本文有点技术难度,需要读者了解C++和

C++ 继承之虚继承与普通继承的内存分布

仅供互相学习,请勿喷,有观点欢迎指出~ class A { virtual void aa(){}; }; class B : public virtual A { char j[3]; //加入一个变量是为了看清楚class中的vfptr放在什么位置 public: virtual void bb(){}; }; class C : public virtual A { char i[3]; public: virtual void cc(){}; }; class C1 : public A

C++ 多继承和虚继承的内存布局(转)

转自:http://www.oschina.net/translate/cpp-virtual-inheritance 警告. 本文有点技术难度,需要读者了解C++和一些汇编语言知识. 在本文中,我们解释由gcc编译器实现多继承和虚继承的对象的布局.虽然在理想的C++程序中不需要知道这些编译器内部细节,但不幸的是多重继承(特别是虚拟继承)的实现方式有各种各样的不太明确的结论(尤其是,关于向下转型指针,使用指向指针的指针,还有虚拟基类的构造方法的调用命令). 如果你了解多重继承是如何实现的,你就能

【整理】C++虚函数及其继承、虚继承类大小

参考文章: http://blog.chinaunix.net/uid-25132162-id-1564955.html http://blog.csdn.net/haoel/article/details/1948051/ 一.虚函数与继承 1.空类,空类单继承,空类多继承的sizeof #include <iostream> using namespace std; class Base1 { }; class Base2 { }; class Derived1:public Base1

More Effective C++----(24)理解虚拟函数、多继承、虚继承和RTTI所需的代价

Item M24:理解虚拟函数.多继承.虚继承和RTTI所需的代价 C++编译器们必须实现语言的每一个特性.这些实现的细节当然是由编译器来决定的,并且不同的编译器有不同的方法实现语言的特性.在多数情况下,你不用关心这些事情.然而有些特性的实现对对象大小和其成员函数执行速度有很大的影响,所以对于这些特性有一个基本的了解,知道编译器可能在背后做了些什么,就显得很重要.这种特性中最重要的例子是虚拟函数. 当调用一个虚拟函数时,被执行的代码必须与调用函数的对象的动态类型相一致:指向对象的指针或引用的类型

c++第十章-(多继承与虚继承)

多继承 class Person { public: Person(std::string theName); void introduce(); protected: std::string name; }; class Teacher : public Person { public: Teacher(std::string theName,std::string theClass); void teach(); void introduce(); protected: std::strin

C++中对C的扩展学习新增内容———面向对象(继承)多继承和虚继承

多继承和虚继承 1.多继承的优缺点 (1) 多继承可以复用多个类的代码(函数,变量). (2) 多继承会带来二义性问题. // 1. 多继承优缺点 class Flyable { public: void fly() { cout << "飞翔..." << endl; } void sound() { cout << "嗖嗖..." << endl; } }; class Runnable { public: voi

多继承(虚继承)派生类对象内存结构

在这里谈一下虚继承.前面写过派生类对象的内存结构,都是基于VS2010编译器的,不同的编译器对于继承的处理不同,但本质都是一样的. 虚继承是解决共享基类问题的.例如在菱形继承中 如果不使用虚继承,基类A在D中会有两个,这不仅浪费内存,还会造成歧义.使用虚继承就可以解决基类共享的问题. 要想在派生类中共享基类(例如在D对象中只有一个A对象,这时候D对象中的B对象和C对象都可以查找到A,而不是在B对象和C对象中各含有一个A对象). 先看下面一个例子: #include<iostream> usin

C++虚继承的实现方式与内存布局

说明:本文给出的结论均是在VS2010下调试的结果. 一.问题引入 下面的四个类是典型的C++虚继承的基本结构,现在的问题是这四个类对象的sizeof分别是多少? class Base{ //虚基类 public: double dou; }; class Derived1 : public virtual Base{ //虚继承 public: double in; }; class Derived2 : public virtual Base{ //虚继承 public: double on