函数调用约定和堆栈

函数调用约定和堆栈

1 什么是堆栈

编译器一般使用堆栈实现函数调用。堆栈是存储器的一个区域,嵌入式环境有时需要程序员自己定义一个数组作为堆栈。Windows为每个线程自动维护一个堆栈,堆栈的大小可以设置。编译器使用堆栈来堆放每个函数的参数、局部变量等信息。

函数调用经常是嵌套的,在同一时刻,堆栈中会有多个函数的信息,每个函数占用一个连续的区域。一个函数占用的区域被称作帧(frame)。

编译器从高地址开始使用堆栈。 假设我们定义一个数组a[1024]作为堆栈空间,一开始栈顶指针指向a[1023]。如果栈里有两个函数a和b,且a调用了b,栈顶指针会指向函数b的 帧。如果函数b返回。栈顶指针就指向函数a的帧。如果在栈里放了太多东西造成溢出,破坏的是a[0]上面的东西。

在多线程(任务)环境,CPU的堆栈指针指向的存储器区域就是当前使用的堆栈。切换线程的一个重要工作,就是将堆栈指针设为当前线程的堆栈栈顶地址。

不同CPU,不同编译器的堆栈布局、函数调用方法都可能不同,但堆栈的基本概念是一样的。

2 函数调用约定

函数调用约定包括传递参数的顺序,谁负责清理参数占用的堆栈等,例如 :

  参数传递顺序 谁负责清理参数占用的堆栈
__pascal 从左到右 调用者
__stdcall 从右到左 被调函数
__cdecl 从右到左 调用者

调用函数的代码和被调函数必须采用相同的函数的调用约定,程序才能正常运行。在Windows上,__cdecl是C/C++程序的缺省函数调用约定。

在有的cpu上,编译器会用寄存器传递参数,函数使用的堆栈由被调函数分配和释放。这种调用约定在行为上和__cdecl有一个共同点:实参和形参数目不符不会导致堆栈错误。

不过,即使用寄存器传递参数,编译器在进入函数时,还是会将寄存器里的参数存入堆栈指定位置。参数和局部变量一样应该在堆栈中有一席之地。参数可以被理解为由调用函数指定初值的局部变量。

3 例子:__cdecl和__stdcall

不同的CPU,不同的编译器,堆栈的布局可能是不同的。本文以x86,VC++的编译器为例。

VC++编译器的已经不再支持__pascal, __fortran, __syscall等函数调用约定。目前只支持__cdecl和__stdcall。

采用__cdecl或__stdcall调用方式的程序,在刚进入子函数时,堆栈内容是一样的。esp指向的栈顶是返回地址。这是被call指令压入堆栈的。下面是参数,左边参数在上,右边参数在下(先入栈)。

如前表所示,__cdecl和__stdcall的区别是:__cdecl是调用者清理参数占用的堆栈,__stdcall是被调函数清理参数占用的堆栈。

由于__stdcall的被调函数在编译时就必须知道传入参数的准确数目(被调函数要清理堆栈),所以不能支持变参数函数,例如printf。而且如果调用者使用了不正确的参数数目,会导致堆栈错误。

通过查看汇编代码,__cdecl函数调用在call语句后会有一个堆栈调整语句,例如:

      a = 0x1234;
      b = 0x5678;
    c = add(a, b);

对应x86汇编:

      mov dword ptr [ebp-4],1234h
      mov dword ptr [ebp-8],5678h
      mov eax,dword ptr [ebp-8]
      push eax
      mov ecx,dword ptr [ebp-4]
      push ecx
      call 0040100a

add esp,8

    mov dword ptr [ebp-0Ch],eax

__stdcall的函数调用则不需要调整堆栈:

      call 00401005
    mov dword ptr [ebp-0Ch],eax

函数

      int __cdecl add(int a, int b)
      {
      return a+b;
    }

产生以下汇编代码(Debug版本):

      push ebp
      mov ebp,esp
      sub esp,40h
      push ebx
      push esi
      push edi
      lea edi,[ebp-40h]
      mov ecx,10h
      mov eax,0CCCCCCCCh
      rep stos dword ptr [edi]
      mov eax,dword ptr [ebp+8]
      add eax,dword ptr [ebp+0Ch]
      pop edi
      pop esi
      pop ebx
      mov esp,ebp
      pop ebp

ret // 跳转到esp所指地址,并将esp+4,使esp指向进入函数时的第一个参数

再查看__stdcall函数的实现,会发现与__cdecl函数只有最后一行不同:

    ret 8 // 执行ret并清理参数占用的堆栈

对于调试版本,VC++编译器在“直接调用地址”时会增加检查esp的代码,例如:

      ta = (TAdd)add; // TAdd定义:typedef int (__cdecl *TAdd)(int a, int b);
    c = ta(a, b);

产生以下汇编代码:

      mov [ebp-10h],0040100a
      mov esi,esp
      mov ecx,dword ptr [ebp-8]
      push ecx
      mov edx,dword ptr [ebp-4]
      push edx

call dword ptr [ebp-10h]
add esp,8

      cmp esi,esp

call __chkesp (004011e0)

    mov dword ptr [ebp-0Ch],eax

__chkesp 代码如下。如果esp不等于函数调用前保存的值,就会转到错误处理代码。

      004011E0 jne __chkesp+3 (004011e3)
      004011E2 ret
    004011E3 ;错误处理代码

__chkesp的错误处理会弹出对话框,报告函数调用造成esp值不正确。 Release版本的汇编代码要简洁得多。也不会增加 __chkesp。如果发生esp错误,程序会继续运行,直到“遇到问题需要关闭”。

3 补充说明

函数调用约定只是“调用函数的代码”和被调用函数之间的关系。

假设函数A是__stdcall,函数B调用函数A。你必须通过函数声明告诉编译器,函数A是__stdcall。编译器自然会产生正确的调用代码。

如果函数A是__stdcall。但在引用函数A的地方,你却告诉编译器,函数A是__cdecl方式,编译器产生__cdecl方式的代码,与函数A的调用约定不一致,就会发生错误。

以delphi调用VC函数为例,delphi的函数缺省采用__pascal约定,VC的函数缺省采用__cdecl约定。我们一般将VC的函数设为__stdcall,例如:

    int __stdcall add(int a, int b);

在delphi中将这个函数也声明为__stdcall,就可以调用了:

      function add(a: Integer; b: Integer): Integer;
    stdcall; external ‘a.dll‘;

因为考虑到可能被其它语言的程序调用,不少API采用__stdcall的调用约定。

时间: 2024-10-05 05:11:14

函数调用约定和堆栈的相关文章

汇编 ? cdecl 函数调用约定,stdcall 函数调用约定

知识点: ? cdecl 函数调用约定 ? stdcall 函数调用约定 ? CALL堆栈平衡 配置属性--> c/c++ -->高级-->调用约定 一.cdecl调用约定 VC++默认约定__cdecl 1.源代码 int __cdecl add1(int a,int b) { return a+b; } 2.生成汇编代码 00401000 /$ 55 PUSH EBP 00401001 |. 8BEC MOV EBP,ESP 00401003 |. 8B45 08 MOV EAX,D

C/C++函数调用约定

C/C++函数调用约定 函数声明部分的extern "C"表示连接规范(Linkage Specification)采用C,而不是C++.如果不写的 话.默认采用C++,当然也可以写成extern "C++". 1.__cdecl: C和C++默认的函数调用约定,参数从右到左顺序压入堆栈,由函数负责清理堆栈,把参数弹出. 也正是因为用来传送参数的堆栈是由调用函数维护的,所以实现可变参数的函数只能使用这种函数调用约定.因为每一个调用它的函数都要包含清理堆栈的代码,所以

C语言函数调用约定

在C语言中,假设我们有这样的一个函数: int function(int a,int b) 调用时只要用result = function(1,2)这样的方式就可以使用这个函数.但是,当高级语言被编译成计算机可以识别的机器码时,有一个问题就凸现出来:在CPU中,计算机没有办法知道一个函数调用需要多少个.什么样的参数,也没有硬件可以保存这些参数.也就是说,计算机不知道怎么给这个函数传递参数,传递参数的工作必须由函数调用者和函数本身来协调.为此,计算机提供了一种被称为栈的数据结构来支持参数传递. 栈

ARM基础:为何C语言(的函数调用)需要堆栈,而汇编语言却不需要堆栈

为何C语言(的函数调用)需要堆栈,而汇编语言却不需要堆栈 之前看了很多关于uboot的分析,其中就有说要为C语言的运行,准备好堆栈. 而自己在Uboot的start.S汇编代码中,关于系统初始化,也看到有堆栈指针初始化这个动作.但是,从来只是看到有人说系统初始化要初始化堆栈,即正确给堆栈指针sp赋值,但是却从来没有看到有人解释,为何要初始化堆栈.所以,接下来的内容,就是经过一定的探究,试图来解释一下,为何要初始化堆栈,即: 为何C语言的函数调用要用到堆栈,而汇编却不需要初始化堆栈. 要明白这个问

为何C语言(的函数调用)需要堆栈,而汇编语言不需要

转自:Uboot中start.S源码中指令级的详尽解析 green-waste为何 C 语言(的函数调用)需要堆栈,而汇编语言却需要堆栈之前看了很多关亍uboot的分析,其中就有说要为C语言的运行,准备好堆栈.而自己在Uboot的start.S汇编代码中,关于系统初始化,也看到有堆栈指针初始化这个动作.但是,从来只看到有人说系统初始化要初始化堆栈,即正确给堆栈指针sp赋值,但是却从来没有看到有人解释,为何要初始化堆栈.所以,接下来的内容,就是经过一定的探究,试图来解释一下,为何要初始化堆栈,即:

3 种关键函数调用约定

高级语言翻译成机器码后,计算机没有办法知道函数调用的参数个数.类型,也没有硬件可以保护这些参数. 另外,在C++中,因为重载的原因,所以对函数的命名方式和普通C语言并不一致,该方式称为名字改编. 函数调用者与函数之间,尤其是跨语言调用接口时,需要一个协议约定来传递参数——栈. 关键流程: 调用时,调用者依次把参数压栈,然后调用函数, 被调用函数,在堆栈中取得数据,并进行计算. 函数计算结束以后,或者调用者.或者函数本身修改堆栈,使堆栈恢复原装. 常见的函数调用约定: stdcall cdecl

c++函数调用约定学习(一)

函数调用约定 常见的函数调用约定[5]:cdecl,stdcall,fastcall,thiscall,naked call MFC调用约定(VS6:Project Settings->C/C++ <Category:Code Generation> Calling convention:) 1, __cdecl(C调用约定.The C default calling convention)C/C++ 缺省调用方式 1)压栈顺序:函数参数从右到左 2)参数栈维护:由调用函数把参数弹出栈,

__stdcall函数调用约定

__stdcall 被这个关键字修饰的函数,其参数都是从右向左通过堆栈传递的(__fastcall 的前面部分由ecx,edx传), 函数调用在返回前要由被调用者清理堆栈. 这个关键字主要见于Microsoft Visual C.C++.GNU的C.C++是另外一种修饰方式:__attribute__((stdcall)) 1函数调用约定 __stdcall是函数调用约定的一种,函数调用约定主要约束了两件事: 1.参数传递顺序 2.调用堆栈由谁(调用函数或被调用函数)清理 常见的函数调用约定:s

C++语言学习(十二)——C++语言常见函数调用约定

C++语言学习(十二)--C++语言常见函数调用约定 一.C++语言函数调用约定简介 C /C++开发中,程序编译没有问题,但链接的时候报告函数不存在,或程序编译和链接都没有错误,但只要调用库中的函数就会出现堆栈异常等现象.上述现象出现在C和C++的代码混合使用的情况下或在C++程序中使用第三方库(非C++语言开发)的情况下,原因是函数调用约定(Calling Convention)和函数名修饰(Decorated Name)规则导致的.函数调用约定决定函数参数入栈的顺序,以及由调用者函数还是被