C编译器剖析_6.3.5 汇编代码生成_为类型转换产生汇编代码

6.3.5 为类型转换产生汇编代码

在这一小节中，我们来讨论一下整型和浮点型之间的类型转换。有些类型转换并不需要在汇编层次进行数据转换，例如int和unsigned int之间的转换只是改变了表达式的类型，对数据本身并无影响，以下表达式“(unsigned int) a”对应的二进制数据为0xFFFFFFFF，而表达式“a”对应的二进制数据也为0xFFFFFFFF。但对相同内容的二进制数据来说，进行“有符号整数的右移”和“无符号整数的右移”的结果是不一样的。换言之，对于int和unsigned
int之间的转换，我们只要在语义检查时，保存转型后的新类型即可，由于其数据本身并没有发生变化，我们不需要产生任何进行数据格式转换的汇编代码。

int a = -1;

unsigned int b;

b = ((unsigned int) a)>> 30; //b为3

b = a >> 30; //b为0xFFFFFFFF

还有一点需要注意的是，UCC编译器总是把低于int的整型先隐式地提升为int，然后再进行其他转换。如下所示，当要进行“short-- > char”的转换时，我们会以int作为中转，实际进行的转换为“short -- > int -- > char”。

short s = 3;

char c=(char)s;

////////////////////对应的中间代码/////////////////

t0 : (int)(short)s; // short先提升为int

c = (char)(int)t0; //再把int截断为char

///////////////////对应的汇编代码///////////////////

movswl s, %eax //两字节的short扩展为4字节的int

movb %al, c //只取低字节赋给c

因此，在UCC编译器的类型转换中，“需要通过汇编代码来进行数据格式转换的”主要有以下几种，其中In分别代表占n字节的有符号整数，Un分别代表占n字节的无符号整数，F4代表float，F8代表double。

(1) “I1、U1、I2或者U2”提升为I4

由“单字节或双字节”的整数进行符号位扩展，得到4字节的整数。

C程序员可以进行“U1 -->U2”的转换，但UCC在语义检查阶段已改为

“U1 --> int -- > U2”的转换。在汇编代码生成阶段，不会遇到“U1 --> U2 ”。

(2) “I4或者U4”截断为I1

只取“4字节的整数”低8位，得到一个单字节的数据。

在汇编层次，“I4或者U4”截断为U1，也是取低8位的数据。

(3) “I4或者U4”截断为I2

只取“4字节的整数”低16位，得到一个双字节的数据。

在汇编层次，“I4或者U4”截断为U2，也是取低16位的数据。

(4) “I4或者U4”转换为“F4或者F8”

通过x87协处理器进行数据格式转换，将整型转换为浮点数。

(5) “F4或者F8”转换为I4或者U4

通过x87协处理器进行数据格式转换，将浮点数转换为整数。

(6) “F4”与“F8”之间互相转换

通过x87协处理器进行数据格式转换，实现float与double之间的转换。

当然，在一些没有浮点协处理器的中低端嵌入式平台上，浮点数运算需要由CPU通过整数运算来得到，这一般会由相应的浮点运算函数库来实现。下面，我们通过一个简单的例子来熟悉一下用于类型转换的汇编代码，如图6.3.12所示。第15行的movsbl指令用于对i1进行符号位扩展，从而得到4字节的int；第18行的movb指令用于传送一个字节的数据，第20行的movw用于传送两个字节的数据。第21至24行用于实现int到float的数据转换，我们在第21行把i4的值入栈，第22行把栈内存中的整数加载到x87中，第23行把经x87转换后的浮点数赋值给f4，第24行进行esp寄存器的调整以保存栈的平衡，这几行汇编代码是由以下模板得来，并非最优，但简单易懂。

TEMPLATE(X86_CVTI4F4, "pushl %1;fildl (%%esp);fstps %0;addl$4, %%esp")

图6.3.12 类型转换对应的汇编代码

图6.3.12第37行从内存加载double型浮点数到x87协处理器中，第38行把转换后的float数据存到f4中。而第25至36行的汇编代码用于实现float到int的数据转换，其中很大一部分代码用来设置x87的控制寄存器，从而设定“四舍五入”的精度。我们已在“第1.5节结合C语言来学汇编_浮点数运算”一节的“图1.30”中分析过这些汇编代码，这里不再重复。第25至36行的汇编代码是根据以下模板产生的，其中用到了寄存器eax，因此在产生这些汇编代码前，我们需要先对寄存器eax进行必要的回写操作。

TEMPLATE(X86_CVTF4I4,

"flds %1;subl $16, %%esp;fnstcw(%%esp);movzwl (%%esp), %%eax;"

"orl $0x0c00, %%eax;movl %%eax,4(%%esp);fldcw 4(%%esp);fistpl 8(%%esp);"

"fldcw (%%esp);movl 8(%%esp),%%eax;addl $16, %%esp")

接下来，我们来讨论一下用于生成这些汇编代码的函数EmitCast，如图6.3.13所示。第9至20行用于实现{I1，U1，I2，U2}到I4的整型提升，我们面对的中间指令形如“< EXTI1,DST, SRC1, NULL>”。我们会在第6行把目的操作数DST保存到局部变量dst中，第12行调用AllocateReg函数为DST分配一个4字节寄存器，如果DST不是临时变量，则分配不成功。此时，我们需要在第14行直接调用GetReg函数来得到一个寄存器，并重新设置中间指令里的DST操作数，这会导致“DST
!= dst”。不论如何，在第16行，我们已得到一个寄存器，不妨记为Rx，第16行通过形如movsbl的汇编指令进行符号位扩展，并把结果存到Rx中。如果“原先的目的操作数dst”不是临时变量，则我们还要在第18行把寄存器Rx中的值传送给dst，最终可得到形如“movsbl i1, %eax; movl %eax, i4”这样的汇编代码。

图6.3.13 EmitCast()

图6.3.13第21至30行用于实现{I4，U4}到I1的截断操作，我们面对的中间指令形如

“< TRUI1, DST, SRC1, NULL>”。如果SRC1的值已经在寄存器中，不妨设其为eax，则我们可在第23行得到eax的低8位对应的寄存器al；否则，我们在第26行获取一个单字节寄存器，不妨设其为al，第27行会把“占4字节的操作数SRC1的值”传送到寄存器eax中，由于eax寄存器的低8位就是寄存器al，因此我们可在第30行把al的值传送给目的操作数DST，最终可产生形如“movl
i4, %eax；movb %al, i1；”的汇编代码。而{I4，U4}到I2的截断操作与此类似，我们在第32行省略了相关代码。

图6.3.13第33至39行用于实现整型到浮点型的转换，我们在第38行调用PutASMCode函数，根据相应的模板来产生汇编代码即可。第42至50行用于实现浮点型到整型的转换，我们面对的中间指令形如“<CVTF4I4, DST, SRC1, NULL>”，其中DST为整数，而SRC1为浮点数。由于在X86_CVTF4I4模板中用到了寄存器eax，因此我们要在第44行调用SpillReg函数对eax进行必要的回写操作，第45行为DST分配一个4字节寄存器，不妨记为Rx，第46行根据X86_CVTF4I4等指令模板产生相应的汇编代码，实现浮点数到整数的转换，结果保存在寄存器eax中。如果中间指令里的操作数DST不是临时变量，或者DST是临时变量但所分配的寄存器不是eax，则我们要在第49行把eax寄存器中的值传送给DST。

时间： 2024-08-09 19:53:49

C编译器剖析_6.3.5 汇编代码生成_为类型转换产生汇编代码

C编译器剖析_6.3.5 汇编代码生成_为类型转换产生汇编代码的相关文章

C编译器剖析_6.3.1 汇编代码生成_由中间指令产生汇编代码的主要流程

C编译器剖析_6.1 汇编代码生成_简介

C编译器剖析_6.2 汇编代码生成_寄存器的管理

C编译器剖析_6.3.6 汇编代码生成_为“取地址”产生汇编指令

C编译器剖析_6.3.4 汇编代码生成_为函数调用与返回产生汇编代码

C编译器剖析_6.3.3 汇编代码生成_为跳转指令产生汇编代码

C编译器剖析_6.3.2 汇编代码生成_由EmitAssign函数产生算术运算的汇编代码

C编译器剖析_5.4.2 中间代码生成及优化_基本块的合并

C编译器剖析_5.3.1 中间代码生成及优化_If语句和复合语句的翻译