Masm64：子程序的定义、调用、递归

陈一男学习网站[ ChenYinan.com ] - CCF - NOI - 菜鸟教程 - 编程题库 - C++语言 - API

一、子程序的定义

1. 定义格式

在MASM64中，子程序（也称为过程或函数）使用PROC和ENDP指令来定义其开始和结束。基本格式如下：

子程序名 PROC [距离属性] [语言类型] [可视性] [USES寄存器列表]
    ; 子程序的代码体
    RET
    子程序名 ENDP
    MySubroutine PROC
    ; 这里是子程序的具体操作
    mov rax, 10h
    ret
MySubroutine ENDP

2. 距离属性

可以是NEAR（近程，在16位模式下使用，表示子程序在当前代码段内）或FAR（远程，在16位模式下用于不同代码段间的调用，在64位模式下较少使用这种区分）。在64位模式下，默认的距离属性通常满足程序的需求，一般不需要显式指定。

3. 语言类型

例如C、STDCALL、SYSCALL等。不同的语言类型规定了函数调用时参数传递的顺序、堆栈的清理方式等规则。

如果指定为C语言类型：参数传递顺序是从右到左，即最后一个参数最先入栈。调用者负责清理堆栈（如果有参数入栈的情况）。

如果是STDCALL：参数传递顺序也是从右到左。被调用者负责清理堆栈。

4. 可视性

可以是PUBLIC（表示该子程序可以被其他模块调用）或PRIVATE（只能在本模块内使用）等。

MyPublicSubroutine PUBLIC PROC
    ; 代码
    ret
MyPublicSubroutine ENDP

5. USES寄存器列表

这是一个可选的部分。如果指定了USES，后面跟着一个寄存器列表，例如USES rax, rbx。当进入子程序时，MASM会自动将列表中的寄存器的值压入堆栈保存起来，在子程序返回前又会自动从堆栈中弹出这些值恢复寄存器，这有助于保护寄存器的值。

二、子程序的调用

1. CALL指令

功能：

用于调用一个已定义的子程序。当执行CALL指令时，程序会将下一条指令的地址（返回地址）压入堆栈，然后跳转到被调用的子程序处开始执行。

假设已经定义了MySubroutine子程序：

main PROC
    call MySubroutine ; 调用MySubroutine子程序
    ; 这里是调用之后的代码
    ret
main ENDP

2. 返回地址的处理

在子程序内部，当执行到RET（返回）指令时，程序会从堆栈中弹出之前压入的返回地址，然后跳转到该地址继续执行主程序。如果在子程序中没有正确处理堆栈（例如在某些情况下没有平衡堆栈，导致返回地址错误），可能会导致程序出错。

3. 参数传递

通过寄存器传递参数：可以利用通用寄存器（如rax、rbx等）在主程序和子程序之间传递参数。

main PROC
    mov rax, 10h
    call MySubroutineWithParam
    ret
main ENDP
MySubroutineWithParam PROC
    ; 在子程序中可以使用传递进来的参数，这里rax的值为10h
    add rax, 5h
    ret
MySubroutineWithParam ENDP

通过堆栈传递参数：如果采用C语言类型的调用约定，参数从右到左入栈。

main PROC
    mov rcx, 20h
    mov rdx, 30h
    call MySubroutineWithStackParams
    ret
main ENDP
MySubroutineWithStackParams PROC
    ; 按照C语言调用约定，rdx的值先入栈，rcx的值后入栈
    ; 在子程序中，可以从堆栈中获取参数
    mov rax, [rsp + 8] ; 获取rcx的值
    mov rbx, [rsp] ; 获取rdx的值
    ret
MySubroutineWithStackParams ENDP

三、递归

1. 概念理解

在MASM64中，递归是指一个子程序（过程）直接或间接地调用自身。这与其他编程语言中的递归概念类似，都是将一个复杂问题分解为与原问题结构相同但规模更小的子问题来求解。

2. 实现要点

保存状态

每次递归调用时，需要保存当前的执行状态，包括寄存器的值、局部变量等。在MASM64中，通常使用堆栈来保存这些信息。因为递归调用会不断深入，每一层递归都有自己的局部环境，而堆栈的后进先出特性适合恢复之前的状态。

设置终止条件

必须明确一个终止条件来停止递归调用。如果没有终止条件，递归将无限进行下去，最终导致堆栈溢出。例如，计算阶乘时，当输入为0或1时，阶乘的值为1，这就可以作为终止条件。

3. 示例：计算阶乘的递归实现

数学原理：阶乘的数学定义为 n! = n*(n - 1)*(n - 2)*...*1，其中0! = 1，1! = 1。

汇编代码实现

factorial PROC
    ; 检查是否为终止条件（n = 0或n = 1）
    cmp rcx, 0
    je factorial_zero
    cmp rcx, 1
    je factorial_zero
    ; 保存当前的rcx（n）值，因为在递归调用中会改变它
    push rcx
    dec rcx
    call factorial
    pop rcx
    mul rcx
    ret
    factorial_zero:
    mov rax, 1
    ret
factorial ENDP

在这个例子中：

首先在factorial子程序中，通过比较rcx寄存器（假设rcx存储着要计算阶乘的数n）的值来判断是否为终止条件（n = 0或n = 1）。

如果不是终止条件，将当前的rcx值压入堆栈保存，然后将rcx减1并递归调用factorial。

当递归调用返回时，从堆栈中弹出之前保存的rcx值，将当前结果（rax，即(n - 1)!）乘以弹出的值（n）得到n!，最后返回结果。

4. 递归的局限性和注意事项

堆栈空间限制

MASM64中递归调用依赖于堆栈来保存状态。如果递归深度过大，可能会耗尽堆栈空间导致程序出错。例如，计算非常大的数的阶乘时，如果采用简单的递归实现，可能会遇到这个问题。

可以通过调整堆栈大小（在操作系统和链接器允许的范围内）或者优化递归算法（如采用尾递归优化等技术，如果编译器支持的话）来缓解这个问题。

性能考虑

递归调用涉及到函数调用的开销，包括参数传递、返回地址的保存和恢复等操作，这可能会导致性能下降。在一些对性能要求较高的场景中，可能需要考虑使用迭代的方式来替代递归，或者对递归算法进行优化。例如，对于某些可以转换为循环结构的简单递归算法，迭代实现可能会更高效。

再谈全局变量与局部变量

1. 全局变量

定义与声明：在MASM64中，全局变量是在数据段（.data或.data?等）中定义的变量，它可以被程序中的多个模块或者多个子程序访问。

.data
globalVar QWORD 10h ; 定义一个64位的全局变量globalVar，并初始化为16进制的10h

作用域：其作用域是整个程序。一旦定义，只要在同一个程序的不同部分（如不同的子程序、不同的代码段等）遵循正确的访问规则，都可以对其进行读写操作。

存储位置与访问方式：全局变量存储在数据段的内存区域。在访问全局变量时，可以直接通过变量名或者其对应的内存地址来进行操作。

main PROC
    mov rax, globalVar ; 将全局变量globalVar的值读取到rax寄存器中
    add globalVar, 5h   ; 对全局变量globalVar的值进行修改，增加十六进制的5h
    ret
main ENDP

使用场景：当多个子程序需要共享数据时，全局变量非常有用。例如，在一个多模块的程序中，不同的模块可能需要访问同一个配置参数，这个参数就可以定义为全局变量。

2. 局部变量

定义方式：在MASM64中，局部变量通常在子程序内部定义。局部变量的定义和使用与堆栈密切相关。

subroutine PROC
    ; 定义局部变量
    sub rsp, 8   ; 在堆栈上分配8个字节（假设定义一个64位的局部变量）
    mov [rsp], rax ; 将rax的值存储到局部变量（堆栈上的位置）
    ; 可以对局部变量进行操作
    mov rax, [rsp]
    add rsp, 8   ; 释放堆栈空间，相当于销毁局部变量
    ret
subroutine ENDP

作用域：局部变量的作用域仅限于定义它的子程序内部。在子程序外部无法直接访问该局部变量。

存储位置与访问方式：局部变量存储在堆栈上。通过调整堆栈指针（RSP）来分配和释放局部变量的存储空间。访问局部变量时，需要根据堆栈指针的当前位置加上偏移量来定位变量在堆栈中的位置。

使用场景：用于在子程序内部临时存储数据，避免对其他部分程序数据的干扰。例如，在一个函数中计算中间结果、临时保存寄存器的值等场景下，使用局部变量可以保证数据的独立性和安全性。