张连聘的专栏

我们知道C语言是一种高级语言,所谓高级语言就是要经过翻译才能在具体平台上运行的程序。而编译程序是一种比较繁琐的程序,它要把高级语言编译和链接后,成为能够在具体平台运行的程序。这其中有很多知识是和操作系统和具体硬件平台相关的,如果你想弄清楚编译程序请学习编译原理,有一本书可以参考《linkers_and_loaders》。

我们这里只是说明一下C语言运行的环境以及和栈的关系。让我们从汇编语言和底层硬件来了解C语言的一些概念和C语言是如何利用栈来进控制过程调用的。

先讲一下栈:

栈是这样一种结构:本事是一段连续的内存空间,怎么使用这样一种内存空间才算是起到了栈的实际作用那,首先要规定这一段连续空间的基地址,然后就从这个地址开始依次放东西。取东西时也是从最上面的开始取。按照上面的方案管理这一段存储空间,就是发挥了栈的作用。因为栈使用的频率实在是太高了,所以在计算机汇编层次就有专门操作栈的指令。包括push(入栈)、pop(出栈)等。

其实栈又有一些逻辑上的分类:

根据先腾出空间再用还是先用再腾空间分为:

1,满堆栈:即入栈后堆栈指针sp指向最后一个入栈的元素。也就是sp先减一(加一)再入栈。

2,空堆栈:即入栈后堆栈指针指向最后一个入栈元素的下一个元素。也就是先入栈sp再减一(或加一)。

根据从高地址开始用还是从低地址开始用分为:

1,递增堆栈:即堆栈一开始的地址是低地址,向高地址开始递增。就如同一个水杯(假设上面地址大)开口的是大地址,从杯底开始装水。自己画一画图就清楚了。我就偷懒一下不画了。

2,递减堆栈:即堆栈一开始的地址是高地址,向低地址开始递增。就如同还是刚才说的那个水杯,现在开口的是小地址,从大地址开始用,往下走,相当于杯子口朝下。我们用的时候是把水往上一点点压上去。呵呵呵,不过这样的杯子就失去了用途。但在内存上还是可以的。

那么根据这两种分类方法,我们就可以得到四种栈的类型,而ARM920T中使用的是递减满堆栈。

下面重点说明c语言运行时是怎么用栈来控制函数调用过程的。

大家想一想,我们写c语言时用到函数调用,有时候还嵌套调用很多函数。还有有些函数还需要参数和返回值。怎么处理各个函数的参数和返回值,以及当每一个函数完成工作时该返回到那个地方。这些都是要解决的问题。当然最容易想到的也是必须做的是在进行调用跳转之前,把我这个函数现有的状态保存起来,保存什么那,调用函数返回后的下一条指令,还有我这个函数需要的哪些数据。还有就是保存这些信息到哪些地方哪?这些都是我们要解决的问题。还有就是你不光要保存这些信息,还要保存这些信息的顺序。因为函数调用本身有顺序,你像a调用b,b又接着调用c。在c执行完后要返回到b,b执行完再返回a。呵呵,有顺序。

我们一一想办法来解决,当然别人已经用栈的策略解决的很完美了,我们只是想一些更简洁的最容易想起来的但是不完善的方法,也正说明了人家的策略是多么的优秀。

关于调用函数的问题,我们可以把返回地址保存到一些地方,当然程序员知道在那?还知道顺序,再根据顺序返回就好了,但做这样的工作太累了,除了写程序还要记这些东西。哎肯定不好也不这样做。关于传参,有这样可以考虑的,用专门规定好的寄存器来做传参。行,但有缺陷,如果传的参数很多或者是变化的,就不好用寄存器传参了。而且我们有操作系统时往往要求编译器产生的代码具有可重入性,也就是保证代码和数据的相对独立性。一个函数被调用两次,都有两次的参数环境。到底现在我们是怎么做的那。答案是用栈。

怎么用,嘻嘻,下面一一道来:

函数在执行一个函数调用调用时,用栈不仅保存函数的返回地址,并且一起把函数所需要的参数和返回值都保存在堆栈中。

也就是每一个函数都有一个这样的栈,保存着一些信息。先说一下栈帧的概念,在函数调用过程中要保存的整个参数集合,包括返回地址称作一个栈帧。

如上图所示,我们以这个图为例,分析一下栈在函数调用中的应用。函数p有两个参数 x1、x2,函数p 调用函数q ,且有两个参数。储存在栈帧的第一帧是上一个栈帧的地址,当前栈帧的地址就是正在使用的栈帧的基值,使用这个指针能方便的找到函数所需的变量和参数等。那为什么每一针的第一个地址要保存上一个栈帧的地址那,和保存返回地址一个初衷,当你当前用的栈帧用完时,把在当前栈帧保存的上一个栈帧的地址取出就还原了上一个栈帧。

接着是返回地址,如果函数有返回值的话,返回值放在返回地址的下面。接着为函数所需要的变量申请空间。

下面说说函数p调用函数q时的具体情况。当执行call q(y1)时,会为函数q创建一个新的栈帧,具体过程是:先保存丄一帧的地址,如果有返回值的话为返回值分配存储空间,然后保存返回地址。然后为y1分配空间并把它初始化为调用q时给的参数。接着分配另一个参数的空间y2,这个参数用于在函数内部计算。

在任何状态下,都有一个当前栈帧的指针fp,,这个指针用来保存当前栈帧的地址,那这个值怎么保证是当前的那,先说q函数的吧,是把栈的指针sp先保存下来,然后接着保存fp。然后把fp的值改为sp-4 ,因为我们知道每个栈帧的第一个要保存的是fp。

其实整个过程是动态的,所谓我说是动态的是因为sp指针一直是快速移动的。所以要在每一帧开始的时候先把这个sp保存住。然后往减4的地址处放fp。当这个栈帧全弹出时,就把你保存的fp又恢复到原来你保存的fp了。就一直有fp代表当前栈帧底部。也是唯一一个不变的基地址,用它来找其他的变量。

好了,下面我们看一个在ARM下C语言写的程序然后编译成汇编语言分析其栈的应用。(在linux2.4内核下写的c语言程序,用arm-linux-gcc3.4.1编译器编译)

C语言源程序如下:

#include<stdio.h>

int max(int,int);

int main(int argc,char *argv[])

{

int a=3,b=5;

max(a,b);

return 0;

}

int max(int x,int y)

{

if(x>y)

return x;

else

return y

}

函数很简单,在主函数里调用一个外部函数max用于两个数中数值较大的那个数并返回。

下面看ARM的汇编是怎么实现的这些功能,以及这中间栈的使用情况。

.file "max.c"

.text

.align 2

.global main

.type main, %function

main:

@ args = 0, pretend = 0, frame = 16

@ frame_needed = 1, uses_anonymous_args = 0

mov ip, sp

stmfd sp!, {fp, ip, lr, pc}

sub fp, ip, #4

sub sp, sp, #16

str r0, [fp, #-16]

str r1, [fp, #-20]

mov r3, #3

str r3, [fp, #-24]

mov r3, #5

str r3, [fp, #-28]

ldr r0, [fp, #-24]

ldr r1, [fp, #-28]

bl max //开始调用max函数

mov r3, #0

mov r0, r3

sub sp, fp, #12

ldmfd sp, {fp, sp, pc}

.size main, .-main

.align 2

.global max

.type max, %function

max:

@ args = 0, pretend = 0, frame = 12

@ frame_needed = 1, uses_anonymous_args = 0

mov ip, sp

stmfd sp!, {fp, ip, lr, pc}

sub fp, ip, #4

sub sp, sp, #12

str r0, [fp, #-16]

str r1, [fp, #-20]

ldr r2, [fp, #-16]

ldr r3, [fp, #-20]

cmp r2, r3

ble .L3

ldr r3, [fp, #-16]

str r3, [fp, #-24]

b .L2

.L3:

ldr r3, [fp, #-20]

str r3, [fp, #-24]

.L2:

ldr r0, [fp, #-24]

sub sp, fp, #12

ldmfd sp, {fp, sp, pc}

.size max, .-max

.ident "GCC: (GNU) 3.4.1"

父母养我不容易,我在学校争口气。

张连聘的专栏

相关文章:

你感兴趣的文章:

标签云: