Cortex-A7常用的汇编指令有哪些呢

什么是GNU汇编语法呢？
Cortex-A7常用的汇编指令有哪些呢？

回帖（1）

刘馨

2021-11-30 15:50:27

前言

  我们在学习 STM32 的时候几乎没有用到过汇编，可能在学习 UCOS、FreeRTOS 等 RTOS类操作系统移植的时候可能会接
触到一点汇编。但是我们在进行嵌入式 Linux 开发的时候是绝
对要掌握基本的 ARM 汇编，因为 Cortex-A 芯片一上电 SP 指针还没初始化，C 环境还没准备好，所以肯定不能运行 C 代码，必须先用汇编语言设置好 C 环境，比如初始化 DDR、设置 SP指针等等，当汇编把 C 环境设置好了以后才可以运行 C 代码。所以 Cortex-A 一开始肯定是汇编代码，其实 STM32 也一样的，一开始也是汇编，以 STM32F103 为例，启动文件startup_stm32f10x_hd.s 就是汇编文件，只是这个文件 ST 已经写好了，我们根本不用去修改，所以大部分学习者都没有深入的去研究。
  I.MX6U-ALPHA 使用的是 NXP 的 I.MX6UL 芯片，这是一款 Cortex-A7 内核的芯片，所以我们主要讲的是 Cortex-A 的汇编指令。对于 Cortex-A 芯片来讲，大部分芯片在上电以后 C 语言环境还没准备好，所以第一行程序肯定是汇编的，至于要写多少汇编程序，那就看你能在哪一步把 C 语言环境准备好。所谓的 C语言环境就是保证 C 语言能够正常运行。C 语言中的函数调用涉及到出栈入栈，出栈入栈就要对堆栈进行操作，所谓的堆栈其实就是一段内存，这段内存比较特殊，由 SP 指针访问，SP 指针指向栈顶。芯片一上电 SP 指针还没有初始化，所以 C 语言没法运行，对于有些芯片还需要初始化 DDR，因为芯片本身没有 RAM，或者内部 RAM 不开放给用户使用，用户代码需要在DDR 中运行，因此一开始要用汇编来初始化 DDR 控制器。后面学习 Uboot 和 Linux 内核的时候汇编是必须要会的，是不是觉得好难啊？还要会汇编！前面都说了只是在芯片上电以后用汇编来初始化一些外设，不会涉及到复杂的代码，而且使用到的指令都是很简单的，用到的就那么十几个指令。所以，不要看到汇编就觉得复杂，打击学习信心。
  GNU 汇编语法

  如果大家使用过 STM32 的话就会知道 MDK 和 IAR 下的启动文件 startup_stm32f10x_hd.s其中的汇编语法是有所不同的，将 MDK 下的汇编文件直接复制到 IAR 下去编译就会出错，因为 MDK 和 IAR 的编译器不同，因此对于汇编的语法就有一些小区别。我们要编写的是 ARM汇编，编译使用的 GCC 交叉编译器，所以我们的汇编代码要符合 GNU 语法。
GNU 汇编语法适用于所有的架构，并不是 ARM 独享的，GNU 汇编由一系列的语句组成，每行一条语句，每条语句有三个可选部分，如下：
  label：instruction @ comment label 即标号，表示地址位置，有些指令前面可能会有标号，这样就可以通过这个标号得到指令的地址，标号也可以用来表示数据地址。注意 label 后面的“：”，任何以“：”结尾的标识符都会被识别为一个标号。
instruction 即指令，也就是汇编指令或伪指令。
@符号，表示后面的是注释，就跟 C 语言里面的“/”和“/”一样，其实在 GNU 汇编文件中我们也可以使用“/”和“/”来注释。comment 就是注释内容。
比如如下代码：
  add: MOVS R0, #0X12 @设置 R0=0X12 上面代码中“add:”就是标号，“MOVS R0,#0X12”就是指令，最后的“@设置 R0=0X12”就是注释。
注意！ARM 中的指令、伪指令、伪操作、寄存器名等可以全部使用大写，也可以全部使用小写，但是不能大小写混用。
用户可以使用.section 伪操作来定义一个段，汇编系统预定义了一些段名：
.text 表示代码段。
.data 初始化的数据段。
.bss 未初始化的数据段。
.rodata 只读数据段。
我们当然可以自己使用.section 来定义一个段，每个段以段名开始，以下一段名或者文件结尾结束，比如：
  .section .testsection @定义一个 testsetcion 段汇编程序的默认入口标号是_start，不过我们也可以在链接脚本中使用 ENTRY 来指明其它的入口点，下面的代码就是使用_start 作为入口标号：
  .global _start _start: ldr r0, =0x12 @r0=0x12 上面代码中.global 是伪操作，表示_start 是一个全局标号，类似 C 语言里面的全局变量一样，常见的伪操作有：
.byte 定义单字节数据，比如.byte 0x12。
.short 定义双字节数据，比如.short 0x1234。
.long 定义一个 4 字节数据，比如.long 0x12345678。
.equ 赋值语句，格式为：.
equ 变量名，表达式，
比如.equ num, 0x12，表示 num=0x12。
.align 数据字节对齐，比如：.align 4 表示 4 字节对齐。
.end 表示源文件结束。
.global 定义一个全局符号，格式为：.global symbol，比如：.global _start。
GNU 汇编还有其它的伪操作，但是最常见的就是上面这些，如果想详细的了解全部的伪操
作，可以参考《ARM Cortex-A(armV7)编程手册 V4.0.pdf》的 57 页。
GNU 汇编同样也支持函数，函数格式如下：
  函数名: 函数体返回语句 GNU 汇编函数返回语句不是必须的，如下代码就是用汇编写的 Cortex-A7 中断服务函数：
  示例代码 7.1.1.1 汇编函数定义 /* 未定义中断 */ Undefined_Handler: ldr r0, =Undefined_Handler bx r0 /* SVC 中断 */ SVC_Handler: ldr r0, =SVC_Handler bx r0 /* 预取终止中断 */ PrefAbort_Handler: ldr r0, =PrefAbort_Handler bx r0 上述代码中定义了三个汇编函数：Undefined_Handler、SVC_Handler 和PrefAbort_Handler。以函数 Undefined_Handler 为例我们来看一下汇编函数组成，“Undefined_Handler”就是函数名，“ldr r0, =Undefined_Handler”是函数体，“bx r0”是函数
返回语句，“bx”指令是返回指令，函数返回语句不是必须的。
  Cortex-A7 常用汇编指令

  处理器内部数据传输指令
使用处理器做的最多事情就是在处理器内部来回的传递数据，常见的操作有：
①、将数据从一个寄存器传递到另外一个寄存器。
②、将数据从一个寄存器传递到特殊寄存器，如 CPSR 和 SPSR 寄存器。
③、将立即数传递到寄存器。数据传输常用的指令有三个：MOV、MRS 和 MSR，这三个指令的用法如表 7.2.1.1 所
示：

  存储器访问指令

  ARM 不能直接访问存储器，比如 RAM 中的数据，I.MX6UL 中的寄存器就是 RAM 类型的，我们用汇编来配置 I.MX6UL 寄存器的时候需要借助存储器访问指令，一般先将要配置的值写入到 Rx(x=0~12)寄存器中，然后借助存储器访问指令将 Rx 中的数据写入到 I.MX6UL 寄存器中。读取 I.MX6UL 寄存器也是一样的，只是过程相反。常用的存储器访问指令有两种：LDR 和STR，用法如表 7.2.1.2 所示：

  压栈和出栈指令

  我们通常会在 A 函数中调用 B 函数，当 B 函数执行完以后再回到 A 函数继续执行。要想在跳回 A 函数以后代码能够接着正常运行，那就必须在跳到 B 函数之前将当前处理器状态保存起来(就是保存 R0-R15 这些寄存器值)，当 B 函数执行完成以后再用前面保存的寄存器值恢复R0-R15 即可。保存 R0~R15 寄存器的操作就叫做现场保护，恢复 R0-R15 寄存器的操作就叫做恢复现场。在进行现场保护的时候需要进行压栈(入栈)操作，恢复现场就要进行出栈操作。压栈的指令为 PUSH，出栈的指令为 POP，PUSH 和 POP 是一种多存储和多加载指令，即可以一次操作多个寄存器数据，他们利用当前的栈指针 SP 来生成地址，PUSH 和 POP 的用法如表 7.2.3.1所示：

假如我们现在要将 R0~R3 和 R12 这 5 个寄存器压栈，当前的 SP 指针指向 0X80000000，处理器的堆栈是向下增长的，使用的汇编代码如下：
  PUSH {R0~R3, R12} @将 R0~R3 和 R12 压栈

图7.2.3.1就是对R0~R3,R12进行压栈以后的堆栈示意图，此时的SP指向了0X7FFFFFEC，假如我们现在要再将 LR 进行压栈，汇编代码如下：
  PUSH {LR} @将 LR 进行压栈

图 7.2.3.2 就是分两步对 R0~R3,R2 和 LR 进行压栈以后的堆栈模型，如果我们要出栈的话就是使用如下代码：
  POP {LR} @先恢复 LR POP {R0~R3,R12} @在恢复 R0~R3,R12 出栈的就是从栈顶，也就是 SP 当前执行的位置开始，地址依次减小来提取堆栈中的数据到要恢复的寄存器列表中。PUSH 和 POP 的另外一种写法是“STMFD SP！”和“LDMFD SP!”，
因此上面的汇编代码可以改为：

STMFD 可以分为两部分：STM 和 FD，同理，LDMFD 也可以分为 LDM 和 FD。看到 STM和 LDM 有没有觉得似曾相识(不是 STM32 啊啊啊啊)，前面我们讲了 LDR 和 STR，这两个是数据加载和存储指令，但是每次只能读写存储器中的一个数据。STM 和 LDM 就是多存储和多加载，可以连续的读写存储器中的多个连续数据。FD 是 Full Descending 的缩写，即满递减的意思。根据 ATPCS 规则,ARM 使用的 FD 类型的堆栈，SP 指向最后一个入栈的数值，堆栈是由高地址向下增长的，也就是前面说的向下增长的堆栈，因此最常用的指令就是 STMFD 和 LDMFD。STM 和 LDM 的指令寄存器列表中编号
小的对应低地址，编号高的对应高地址。
  跳转指令

  有多种跳转操作，比如：
①、直接使用跳转指令 B、BL、BX 等。
②、直接向 PC 寄存器里面写入数据。
上述两种方法都可以完成跳转操作，但是一般常用的还是 B、BL 或 BX，用法如表 7.2.4.1：

我们重点来看一下 B 和 BL 指令，因为这两个是我们用的最多的，如果要在汇编中进行函数调用使用的就是 B 和 BL 指令：
1 、B 指令
这是最简单的跳转指令，B 指令会将 PC 寄存器的值设置为跳转目标地址，一旦执行 B 指令，ARM 处理器就会立即跳转到指定的目标地址。如果要调用的函数不会再返回到原来的执行处，那就可以用 B 指令，如下示例：
  示例代码 7.2.4.1 B 指令示例 1 _start: 2 3 ldr sp,=0X80200000 @设置栈指针 4 b main @跳转到 main 函数上述代码就是典型的在汇编中初始化 C运行环境，然后跳转到C文件的 main函数中运行，上述代码只是初始化了 SP 指针，有些处理器还需要做其他的初始化，比如初始化 DDR 等等。因为跳转到 C 文件以后再也不会回到汇编了，所以在第 4 行使用了 B 指令来完成跳转。
2 、BL 指令
BL 指令相比 B 指令，在跳转之前会在寄存器 LR(R14)中保存当前 PC 寄存器值，所以可以通过将 LR 寄存器中的值重新加载到 PC 中来继续从跳转之前的代码处运行，这是子程序调用
一个基本但常用的手段。比如 Cortex-A 处理器的 irq 中断服务函数都是汇编写的，主要用汇编来实现现场的保护和恢复、获取中断号等。但是具体的中断处理过程都是 C 函数，所以就会存在汇编中调用 C 函数的问题。而且当 C 语言版本的中断处理函数执行完成以后是需要返回到irq 汇编中断服务函数，因为还要处理其他的工作，一般是恢复现场。这个时候就不能直接使用B 指令了，因为 B 指令一旦跳转就再也不会回来了，这个时候要使用 BL 指令，示例代码如下：
  示例代码 7.2.4.2 BL 指令示例 1 push {r0, r1} @保存 r0,r1 2 cps #0x13 @进入 SVC 模式，允许其他中断再次进去 3 5 bl system_irqhandler @加载 C 语言中断处理函数到 r2 寄存器中 6 7 cps #0x12 @进入 IRQ 模式 8 pop {r0, r1} 9 str r0, [r1, #0X10] @中断执行完成，写 EOIR 算术运算指令