Delphi接口的底层实现（接口在内存中仍然有其布局，它依附在对象的内存空间中，有汇编解释）——接口的内存结构图，简单清楚，深刻 good

引言

接口是面向对象程序语言中一个很重要的元素，它被描述为一组服务的集合，对于客户端来说，我们关心的只是提供的服务，而不必关心服务是如何实现的；对于服务端的类来说，如果它想实现某种服务，实现与该服务相关的接口即可，它也不必与使用服务的客户端进行过多的交互。这种良好的设计方式已经受到很广泛的应用。

早在Delphi 3的时候就引入了接口的概念，当时完全是因为COM的出现而诞生的，但经过这么多版本的进化，Delphi的接口已经成为Object Pascal语言的一部分，我们完全可以用接口来完成我们的设计，而不用考虑与COM相关的东西。

那么接口在Delphi中是如何实现的呢，很多人想得很复杂，其实它的本质不过也是一些简单的数据结构和调用规则。笔者假设读者已经有接口的使用经验，本文试图向你展示接口在Delphi中的实现过程，使你在使用接口的时候，知其然而知其所以然。

接口在内存中的分布

接口在概念上并不是一个实体，它需要与实现接口的类关联，如果脱离了这些类，接口就变得没有意义了。但接口在内存中仍然有其布局，它依附在对象的内存空间中。

Delphi对象本质上是一个指向特定内存空间的指针，这块内存的前四个字节是一个指针指向类的VMT表，接下来排布对象的数据成员，如果对象实现了接口，则在后面又排着一系列指针，我们可以认为这些指针就是对应的接口，每个指针就指向一个接口方法表。我们来看一下简单的例子：

type
  ITest1 = interface
  [‘{5347BB0D-89B7-4674-A991-5C527BE6F8A8}‘]
    procedure SayHello1;
  end;

ITest2 = interface
  [‘{567B86BB-711D-40C2-8E5E-364B742C2FF1}‘]
    procedure SayHello2;
  end;

TTest = class(TInterfacedObject, ITest1, ITest2)
  public
    procedure SayHello1;
    procedure SayHello2;
  end;
... ...
implementation

{ TTest }
procedure TTest.SayHello1;
begin

showMessage(IntToStr(FRefCount));
ShowMessage(‘Itest1 say hello‘);
end;

procedure TTest.SayHello2;
begin

ShowMessage(IntToStr(FRefCount));
ShowMessage(‘Itest2 say hello‘);
end;

end.

上面是两个接口的声明以及一个实现接口的类，TTest类在内存中的分布可以用下图来表示：

其中FRefCount为父类TInterfacedObject的一个成员，接下来存放的是TInterfacedObject实现的接口IInterface，再下来分别是TTest类实现的ITest2和ITest1指针。各个接口指针分别指向各自的方法表，注意ITest2和ITest1是从IInterface继承下来的，所以自然就有了IInterface的所有方法。方法表中每个指针指向方法真正实现的地方，其实这个说法只是暂时的，稍后会解释方法表中的指针真正指向的地方，并说明其原因。

上面的内存分布并非笔者随意想出来的，而是经过多次测试证实的，下面我们用一些代码来证实上面分布图：

var

test: Itest2;

begin

test := TTest.Create;

test.SayHello2;

end;

在证明接口的内存布局之前，需要了解接口的变量是个什么东西，比如上面的test是什么，它的本质上是一个指针，在没有被赋值之前，它指向空；而得到对象的赋值之后，它指向上面分布图中的Itest2处，对于同一个对象的多个接口变量来说，它们的“值”不一定是相等的，比如有下面的代码：

Var

Test1: ITest1;

Test2: ITest2;

Test: TTest;

Begin

Test := Ttest.Create;

Test1 := Test;

Test2 := Test;

If Integer(Test1) <> Integer(Test2) then

ShowMessage(‘it is not eqeual‘);

End;

最后，会弹出一个对话框，说明Test1和Test2是不相等的；只有属性同一种接口类型，这两个变量才会相等，比如Test1和Test2都是Iinterface，则他们的“值”是相等的。

好了，回过头来看看之前的代码片段吧，在第4行设置断点，运行程序并使上面代码执行，程序执行到断点处中止，按下Ctrl+Alt+C调用CPU窗口,可以看到下面的反汇编代码：

Unit1.pas.49: test := TTest.Create;

mov dl,$01

mov eax,[$00458e0c]; eax指向VMT的地址

call TObject.Create; 创建TTest对象，eax指向TTest对象的首地址

mov edx,eax; edx指向eax指向的地方，edx也指向TTest对象的首地址

test edx,edx; 测试TTest对象是否有效

jz +$03

sub edx,-$0c; 对象首地址偏移12个字节，到ITest2指针处

lea eax,[ebp-$04]; test变量的地址是ebp-04的值，eax指向这个地址

call @IntfCopy; 调用IntfCopy，将edx的值拷贝给eax，引用计数管理

Unit1.pas.50: test.SayHello2;

mov eax,[ebp-$04]; 将test指向的地址赋给eax,此时eax指向Itest2的地址

mov edx,[eax]; 将eax的内容赋给edx，此时edx指向ITest2指向的方法表

call dword ptr [edx+$0c]; 调用ITest2指向的方法表偏移12个字节处。

... ...

ret

sub edx,-$0c这一句，edx原来指向对象的内存空间，偏移12个字节刚好到哪里呢？刚好到ITest2接口指针处。接下来eax指向Test变量在栈中的地址，此时如果直接将edx赋值给eax在逻辑上也没有错，但这样就不能对接口进行引用计数的管理了。因此要调用IntfCopy，进行接口地址的赋值，再加上一个引用计数。

IntfCopy其实是调用System单元中的_IntfCopy，它的实现如下：

procedure _IntfCopy(var Dest: IInterface; const Source: IInterface);
{$IFDEF PUREPASCAL}
var
  P: Pointer;
begin
  P := Pointer(Dest); //保存Dest，无引用计数
  if Source <> nil then
    Source._AddRef; //增加Source的引用计数，即增加ITest2的引用计数
  Pointer(Dest) := Pointer(Source); //将Source的值赋给Dest，无引用计数
  if P <> nil then
    IInterface(P)._Release;  //减少目标接口的引用计数，但这里的P为空指针，所以不会调用这句
end;

此时的Dest参数是eax，亦即Test变量的地址，Source参数是edx，正好是对象内容空间中的ITest2的地址。我们看到其中只是对接口地址的拷贝，及增加接口的引用计数。如果Dest有内容，则减少它的引用计数，不过这里Dest为空，所以不会调用减少引用计数的代码。

接下来到call dword ptr [edx+$0c]，edx指向ITest2指向的方法表首地址，而edx+$0c偏移到哪里呢，看看上面的内存图，正好到ISayHello2处。此时调用ISayHello2指向地址的代码，我们可以简单地认为就是调用TTest.SayHello2。但事实上却不是这样的，为什么？因为在调用SayHello2之前，要先指定eax的值为TTest对象的Self指针，以此作为隐含参数传进SayHello2。

我们可以到[edx+$0c]的地址看看，按F8将执行点执行到call dword ptr [edx+$0c]这一句，再按F7，跳到[edx+$0c]的地址，可以看到下面的反汇编代码：

add eax,-$0c; eax向上偏移12个字节正好是对象内存首地址。

jmp TTest.SayHello2；跳到TTest.SayHello2处。

仔细看前面的汇编码，可以知道eax正好指向ITest2指针，向上偏移12个字节则好就到了对象内存的首地址。接着调用TTest.SayHello2完成。

通过上面的例子，不仅证明了接口在对象内存空间中的布局，还可以得出以下结论：

1. 一个实现特定接口的对象创建完之后赋给该接口，编译器作了一些工作，使得接口变量指向了对象内存中的某个特定地址。

2. 调用接口的方法时，实际上调用的是接口方法表中特定的地址，在该地址处编译器计算出实现该接口的对象内存首地址，再调用对象相应的方法。

接口内存空间的形成

上节说明了接口在对象内存空间中的分布，但对象内存空间是在运行时生成的，那么接口的内存空间是如何生成的呢，这一节将阐述之。

在此之前，让我们再回到上面的对象内存图，对象内存的首地址是一个指针，指向一张VMT表，而Delphi的类其实也是一个指针，这个指针正好也指向VMT表。类是在编译时就确定下来的，VMT表当然也是编译器生成的。

VMT表在负偏移vmtIntfTable（-72）字节处是一个指针，它指向下面的数据结构：PInterfaceTable = ^TInterfaceTable;

TInterfaceTable = packed record

EntryCount: Integer;

Entries: array[0..9999] of TInterfaceEntry;

end;

EntryCount表示对象实现的接口数。

Entries是一个指向TInterfaceEntry结构的数组，TInterfaceEntry表示了一个接口的进入点，它的声明如下：

PInterfaceEntry = ^TInterfaceEntry;

TInterfaceEntry = packed record

IID: TGUID;

VTable: Pointer;

IOffset: Integer;

ImplGetter: Integer;

end;

IID表示接口的GUID，如果接口没有指定GUID，则它里面的值全为0。

VTable指向接口的方法表。

IOffset指明接口与对象首地址的偏移。

ImplGetter是一个方法指针，当IOffset不可用时指向接口的地址，一般不用，初始化为0。

上面的数据结构在编译期就生成了，那么当一个对象创建时，相应的接口内存是如何生成的呢。在对象创建完毕之后，会调用TObejct.InitInstance(Instance: Pointer)类方法初始化对象的数据。看其代码：

class function TObject.InitInstance(Instance: Pointer): TObject;
{$IFDEF PUREPASCAL}
var
  IntfTable: PInterfaceTable;
  ClassPtr: TClass;
  I: Integer;
begin
//将对象全部清0
  FillChar(Instance^, InstanceSize, 0);
//指定首地址为Self，即指向VMT的指针
  PInteger(Instance)^ := Integer(Self);
  ClassPtr := Self;
  //建立对象的接口内存分布
  while ClassPtr <> nil do
  begin
    //取得接口表
    IntfTable := ClassPtr.GetInterfaceTable;
    if IntfTable <> nil then
      for I := 0 to IntfTable.EntryCount-1 do
      with IntfTable.Entries[I] do
      begin
        if VTable <> nil then
        //对象偏移IOffset处，设定为指向VTable的指针
        PInteger(@PChar(Instance)[IOffset])^ := Integer(VTable);
      end;
    //继续建立其父类的接口内存内存
    ClassPtr := ClassPtr.ClassParent;
  end;
  Result := Instance;
end;

我们看PInteger(@PChar(Instance)[IOffset])^ := Integer(VTable)这一句，@PChar(Instance)[IOffset]是对象偏移IOffset的地址，而IOffset是IntfTable.Entries[I]的IOffset，这个值在编译期就指定了，是接口到对象的偏移值。所以，经过上面方法调用之后，对象的内存空间就如同前面所画一样了。

现在我们对接口在内存的来龙去脉已经了如指掌，可以利用这些知识来实现一些非常的功能了。在我们的经验中，对象生成之后可以直接赋给一个接口，编译器会自动将指针偏移到接口处。但如果反过来，将一个接口赋给一个对象却是不允许的，因为信息不足啊，任何类都可以实现这个接口，编译器并不知道这个接口是由那个类实现的，所以就无从转换了。如果我们提供一个现实该接口的类，再根据该类的VMT中的接口信息，就可以得到IOffset了，如此一来不就可以偏移到对象的首地址了吗，下面的例程可以从一个接口得到实现该接口的对象，前提是必须提供实现这个接口的类：

function GetObjFromIntf(AClass: TClass; const Intf: IInterface): TObject;
var
  PIntfTable: PInterfaceTable;
  IntfEntry: TInterfaceEntry;
  i: Integer;
begin
  Result := nil;
  //取得接口表结构
  PIntfTable := AClass.GetInterfaceTable;
  if PIntfTable = nil then Exit;
  while AClass <> nil do
  begin
    for i := 0 to PIntfTable^.EntryCount - 1 do
    begin
      IntfEntry := PIntfTable^.Entries[i];
      //判断接口表指向的地址是否和传入接口指向的地址相同
      if PPointer(Intf)^ = IntfEntry.VTable then
      begin

//偏移到对象首地址
        Result := TObject(Integer(Intf) - IntfEntry.IOffset);
        Exit;
      end;
    end;
    //继续在父类中找
    AClass := AClass.ClassParent;
  end;
end;

看下面例子：

var
  Intf: Itest2;
  Obj: TTest;
begin
  Intf := TTest.Create;
  Intf.SayHello2;
  Obj := TTest(GetObjFromIntf(TTest, Intf));
  Obj.SayHello1;
end;

执行上面代码，先弹出Hello2的对话框，再弹出Hello1的对象，说明GetObjFromIntf函数执行成功，我们实现了从接口到对象的转换过程。

接口的引用计数

上面接口的内存空间与COM的接口在二进制上是兼容的，即接口就是一个指向VTable的指针，与COM兼容的还有另一个特性，就是通过引用计数自动管理COM对象的生命周期。C++程序员必须手工去管理引用计数的增减，而Delphi编译器帮我们做了这些事情，因为引用计数是有规律，只要遵循这些规律，便能自动管理引用计数的增减。IInterface的声明如下：

IInterface = interface

[‘{00000000-0000-0000-C000-000000000046}‘]

function QueryInterface(const IID: TGUID; out Obj): HResult; stdcall;

function _AddRef: Integer; stdcall;

function _Release: Integer; stdcall;

end;

任何实现IInterface的类都必须实现上面三个方法，其中的_AddRef和_Release就是实现引用计数管理的。Delphi提供了IInterfaceObject类默认实现Interface，它声明一个成员FRefCount: Integer指定引用计数，_AddRef被调用时只是将FRefCount增1：

Result := InterlockedIncrement(FRefCount);

_Release被调用时，减少FRefCount，如果FRefCount为0时，即调用Destroy消毁自己：

Result := InterlockedDecrement(FRefCount);

if Result = 0 then

Destroy;

如果即想实现接口，而不想通过引用计数管理生命周期的，可以在AddRef和Release中简单地将结果返回为-1即可，TComponent类即是如此。

那么Delphi是如何实现接口引用计数的管理的呢，有下面的规律：

1. 当一个非空的接口变量要赋值给另一个接口变量时，非空的接口变量应该要调用AddRef。

2. 当一个非空的接口变量要被另一个接口变量赋值时，非空的接口变量应该要调用Release。

3. 如果你对于接口的引用计数有足够了解的话，有些AddRef和Release可以被优化掉。

对于第一种情况，在上节中已经有描述，看_CopyIntf的代码。对于第二种情况，在有接口变量声明及应用的例程中，编译器会在例程结束处调用_IntfClear，代码如下：

function _IntfClear(var Dest: IInterface): Pointer;
{$IFDEF PUREPASCAL}
var
  P: Pointer;
begin
  Result := @Dest;
  if Dest <> nil then
  begin
    P := Pointer(Dest);//先保存接口
    Pointer(Dest) := nil;//将接口清空
    IInterface(P)._Release;//调用原接口方法，减少引用计数
  end;
end;

由上可见，我们不能随意调用_AddRef和_Release，不然将会打乱接口的引用计数，像上面的代码，只是调用了一下_Release，如果对象的引用计数不为0，则它是不会被释放的。

关于接口的引用计数，交给编译器去管理就行了，我们只要遵循一些规则，就可以灵活地使用接口进行程序的设计了。

接口的转换

接口的另一个特性是：被一个类所实现的多个接口应该是可以互相转换的。方法是调用QueryInterface(const IID: TGUID; out Obj): HResult;

对于这个特性的实现，我不想在这里罗嗦，实际上只要理解了第一部分和第二部分，这个特性是很容易推断出怎样实现的，更何况源代码就在那儿，何不给自己一个练习的机会呢？

时间： 2024-08-06 19:49:25

Delphi接口的底层实现（接口在内存中仍然有其布局，它依附在对象的内存空间中，有汇编解释）——接口的内存结构图，简单清楚，深刻 good的相关文章

iOS之在内存中绘图

与直接在UIView控件上绘图不同,在内存中绘图时,需要开发者自己准备绘图环境,Quartz 2D提供了一个非常便捷的函数:UIGraphicsBeginImageContext(CGSize size),该函数用于准备绘图环境.当图形绘制完成后,可调用UIGraphicsEndImageContext()函数结束绘图和关闭绘图环境. 总结来说,在内存中绘图的步骤如下. 调用UIGraphicsBeginImageContext(CGSize size)函数准备绘图环境. 调用UIGraphic

字符在内存中最终的表示形式是什么？是某种字符编码还是码位(Code Point)？

字符在内存中最终的表示形式是什么?是某种字符编码还是码位(Code Point)? 根据我的了解,编码中有三个核心概念:1. 字符集(Character Set),可以说是一个抽象概念,字符的合集2. 码位(Code Point),将抽象的字符集中每一个字符映射到一个整数3. 字符编码(Encoding),按照某种编码规则用二进制来表示一个字符我对码位这个概念理解的不是很清楚,Code point中说: The notion of a code point is used for abstra

DEBUG模式下, 内存中的变量地址分析

测试函数的模板实现 [cpp] view plain copy /// @file my_template.h /// @brief 测试数据类型用的模板实现 #ifndef MY_TEMPLATE_H_2016_0123_1226 #define MY_TEMPLATE_H_2016_0123_1226 template<int iArySize> void fnTestDataType() { char szBuf[iArySize] = {'\0'}; unsigned short wT

C# CLR via 对象内存中堆的存储【类型对象指针、同步块索引】

最近在看书,看到了对象在内存中的存储方式. 讲到了对象存储在内存堆中,分配的空间除了类型对象的成员所需的内存量,还有额外的成员(类型对象指针. 同步块索引 ),看到这个我就有点不懂了,不知道类型对象指针是什么,指向的什么? 从网上找也没有找到,最后往下看,书中有些描述.说下我的理解: 类型对象指针:指向类型对象存储的地址,假如有一个类型Person,它在堆中有一块区域存储它内部的字段和成员以及两个额外成员(类型对象指针. 同步块索引 ),类型对象的类型对象指针指向的是System.Type的地址

内存中OLTP（Hekaton）里的事务日志记录

在今天的文章里,我想详细讨论下内存中OLTP里的事务日志如何写入事务日志.我们都知道,对于你的内存优化表(Memory Optimized Tables),内存中OLTP提供你2个持久性(durability)选项: SCHEMA_ONLY SCHEMA_AND_DATA 今天我不想更多讨论SCHEMA_ONLY,因为使用这个选项,在事务日志里没有发生任何日志(SQL Server 重启后你的数据会丢失).今天我们会专门讲解下SCHEMA_AND_DATA选项的持久性. SCHEMA_AND_D

SQL Server 内存中OLTP内部机制概述（三）

----------------------------我是分割线------------------------------- 本文翻译自微软白皮书<SQL Server In-Memory OLTP Internals Overview>:http://technet.microsoft.com/en-us/library/dn720242.aspx 译者水平有限,如有翻译不当之处,欢迎指正. ----------------------------我是分割线---------------

35．按要求编写Java程序：（1）编写一个接口：InterfaceA，只含有一个方法int method(int n)；（2）编写一个类：ClassA来实现接口InterfaceA，实现int method(int n)接口方法时，要求计算1到n的和；（3）编写另一个类：ClassB来实现接口InterfaceA，实现int method(int n)接口方法时，要求计算n的阶乘（n

35．按要求编写Java程序: (1)编写一个接口:InterfaceA,只含有一个方法int method(int n): (2)编写一个类:ClassA来实现接口InterfaceA,实现int method(int n)接口方法时,要求计算1到n的和: (3)编写另一个类:ClassB来实现接口InterfaceA,实现int method(int n)接口方法时,要求计算n的阶乘(n!): (4)编写测试类E,在测试类E的main方法中使用接口回调的形式来测试实现接口的类. p

被动接口在rip，eigrp，ospf中的应用

被动接口的概念是:阻止从该接口发送路由更新.除了BGP之外的所有基于IP路由协议都可以使用被动接口, 一.在RIP中使用被动接口 1.使用被动接口的目的在某些网络环境中,我们不希望将RIP更新发送给某些路由器或者说发送到某个网络中去,我们就可以使用passive-interface这个命令阻止RIP更新广播从指定接口发送到外界,但是这一接口任然可以接受RIP更新 2.passive-interface的原理应用了passive-interface的接口,也就是被动接口,是不能够发送广播和组播的

从内存中加载DLL DELPHI版

//从内存中加载DLL DELPHI版 unit MemLibrary; interface uses Windows; function memLoadLibrary(pLib: Pointer): DWord; function memGetProcAddress(dwLibHandle: DWord; pFunctionName: PChar): Pointer; stdcall; function memFreeLibrary(dwHandle: DWord): Boolean; imp