发 帖  
原厂入驻New
[资料]

【正点原子FPGA连载】附录A2 ARM汇编基础-领航者ZYNQ之linux开发指南

2020-9-20 17:18:18  94 正点原子FPGA
分享
1)实验平台:正点原子领航者ZYNQ开发板
2)平台购买地址:https://item.taobao.com/item.htm?&id=606160108761
3)全套实验源码+手册+视频下载地址:http://www.openedv.com/docs/boards/FPGA/zdyz_linhanz.html
4)对正点原子FPGA感兴趣的同学可以加群讨论:876744900
5)关注正点原子公众号,获取最新资料


附录A2 ARM汇编基础

ARM处理器的指令集可以分为跳转指令、数据处理指令、程序状态寄存器(PSR)传输指令、加载/存储指令、协处理器指令和异常产生指令6大类。由于本书着重于嵌入式Linux驱动的开发,对于汇编指令简要介绍,满足我们学习即可。
领航者使用的是xilinx的ZYNQ芯片,这是一款带有双核Cortex-A9内核的芯片,所以我们主要讲的是Cortex-A的汇编指令。为此我们需要参考两份跟Cortex-A内核有关的文档:《ARM ArchitectureReference Manual ARMv7-A and ARMv7-R edition.pdf》和《ARM Cortex-A(armV7)编程手册V4.0.pdf》,第一份文档主要讲解ARMv7-A和ARMv7-R指令集的开发,Cortex-A9使用的是ARMv7-A指令集,第二份文档主要讲解Cortex-A(armV7)编程的,这两份文档是学习Cortex-A不可或缺的文档。在《ARM ArchitectureReference Manual ARMv7-A and ARMv7-R edition.pdf》的A4章详细的讲解了Cortex-A的汇编指令,要想系统的学习Cortex-A的指令就要认真的阅读A4章节。
对于Cortex-A芯片来讲,大部分芯片在上电以后C语言环境还没准备好,所以第一行程序肯定是汇编的,至于要写多少汇编程序,那就看你能在哪一步把C语言环境准备好。所谓的C语言环境就是保证C语言能够正常运行。C语言中的函数调用涉及到出栈入栈,出栈入栈就要对堆栈进行操作,所谓的堆栈其实就是一段内存,这段内存比较特殊,由SP指针访问,SP指针指向栈顶。芯片一上电SP指针还没有初始化,所以C语言没法运行,对于有些芯片还需要初始化DDR,因为芯片本身没有RAM,或者内部RAM不开放给用户使用,用户代码需要在DDR中运行,因此一开始要用汇编来初始化DDR控制器。学习Uboot和Linux 内核的时候汇编是必须要会的,是不是觉得好难啊?还要会汇编!前面都说了只是在芯片上电以后用汇编来初始化一些外设,不会涉及到复杂的代码,而且使用到的指令都是很简单的,用到的就那么十几个指令。所以,不要看到汇编就觉得复杂,打击学习信心。
A2.1 GNU汇编语法
如果大家使用过STM32的话就会知道MDK和IAR下的启动文件startup_stm32f10x_hd.s其中的汇编语法是有所不同的,将MDK下的汇编文件直接复制到IAR下去编译就会出错,因为MDK和IAR的编译器不同,因此对于汇编的语法就有一些小区别。我们要编写的是ARM汇编,编译使用的GCC交叉编译器,所以我们的汇编代码要符合GNU语法。
GNU汇编语法适用于所有的架构,并不是ARM独享的,GNU汇编由一系列的语句组成,每行一条语句,每条语句有三个可选部分,如下:
  • label:instruction @ comment

label即标号,表示地址位置,有些指令前面可能会有标号,这样就可以通过这个标号得到指令的地址,标号也可以用来表示数据地址。注意label后面的冒号“:”,任何以冒号“:”结尾的标识符都会被认识是一个标号。
instruction即指令,也就是汇编指令或伪指令。
@符号,表示后面的是注释,就跟C语言里面的“/*”和“*/”一样,其实在GNU汇编文件中我们也可以使用“/*”和“*/”来注释。
comment就是注释内容。
比如如下代码:
  • add:
  • MOVS R0, #0X12 @设置R0=0X12

上面代码中“add:”就是标号,“MOVS R0,#0X12”就是指令,最后的“@设置R0=0X12”就是注释。
注意:ARM中的指令、伪指令、伪操作、寄存器名等可以全部使用大写,也可以全部使用小写,但是不能大小写混用。
用户可以使用.section伪操作来定义一个段,汇编系统预定义了一些段名:
.text 表示代码段。
.data 初始化的数据段。
.bss 未初始化的数据段。
.rodata 只读数据段。
我们当然可以自己使用.section来定义一个段,每个段以段名开始,以下一段名或者文件结尾结束,比如:
.section .testsection @定义一个testsetcion段
汇编程序的默认入口标号是_start,不过我们也可以在链接脚本中使用ENTRY来指明其它的入口点,下面的代码就是使用_start作为入口标号:
  • .global _start
  • _start:
  • ldr r0, =0x12 @r0=0x12
  • 上面代码中.global是伪操作,表示_start是一个全局标号,类似C语言里面的全局变量一样,常见的伪操作有:
  • .byte 定义单字节数据,比如.byte 0x12。
  • .short 定义双字节数据,比如.byte 0x1234。
  • .long 定义一个4字节数据,比如.long 0x12345678。
  • .equ 赋值语句,格式为:.equ 变量名,表达式,比如.equ num, 0x12,表示num=0x12。
  • .align 数据字节对齐,比如:.align 4表示4字节对齐。
  • .end 表示源文件结束。
  • .global 定义一个全局符号,格式为:.global symbol,比如:.global _start。


GNU汇编还有其它的伪操作,但是最常见的就是上面这些,如果想详细的了解全部的伪操作,可以参考《ARM Cortex-A(armV7)编程手册V4.0.pdf》的57页。
GNU汇编同样也支持函数,函数格式如下:
函数名:
函数体
返回语句
GNU汇编函数返回语句不是必须的,如下代码就是用汇编写的Cortex-A9中断服务函数:
示例代码 汇编函数定义
  • /* 未定义中断 */
  • Undefined_Handler:
  • ldr r0, =Undefined_Handler
  • bx r0
  • /* SVC中断 */
  • SVC_Handler:
  • ldr r0, =SVC_Handler
  • bx r0
  • /* 预取终止中断 */
  • PrefAbort_Handler:
  • ldr r0, =PrefAbort_Handler
  • bx r0


上述代码中定义了三个汇编函数:Undefined_Handler、SVC_Handler和PrefAbort_Handler。以函数Undefined_Handler为例我们来看一下汇编函数组成,
“Undefined_Handler”就是函数名,“ldr r0, =Undefined_Handler”是函数体,“bx r0”是函数返回语句,“bx”指令是返回指令,函数返回语句不是必须的。
A2.2 Cortex-A9常用汇编指令
本节我们将介绍一些常用的Cortex-A9汇编指令,如果想系统的了解Cortex-A9的所有汇编指令请参考《ARM ArchitectureReference Manual ARMv7-A and ARMv7-R edition.pdf》的A4章节。
A2.2.1 处理器内部数据传输指令
使用处理器做的最多事情就是在处理器内部来回的传递数据,常见的操作有:
①、将数据从一个寄存器传递到另外一个寄存器。
②、将数据从一个寄存器传递到特殊寄存器,如CPSR和SPSR寄存器。
⑥、将立即数传递到寄存器。
数据传输常用的指令有三个:MOV、MRS和MSR,这三个指令的用法如下表所示:
表A2.2.1 常用数据传输指令


分别来详细的介绍一下如何使用这三个指令:
1、mov指令
MOV指令用于将数据从一个寄存器拷贝到另外一个寄存器,或者将一个立即数传递到寄存器里面,使用示例如下:
  • MOV R0,R1 @将寄存器R1中的数据传递给R0,即R0=R1
  • MOV R0, #0X12 @将立即数0X12传递给R0寄存器,即R0=0X12

2、MRS指令
MRS指令用于将特殊寄存器(如CPSR和SPSR)中的数据传递给通用寄存器,要读取特殊寄存器的数据只能使用MRS指令。使用示例如下:
MRS R0, CPSR @将特殊寄存器CPSR里面的数据传递给R0,即R0=CPSR
3、MSR指令
MSR指令和MRS刚好相反,MSR指令用来将普通寄存器的数据传递给特殊寄存器,也就是写特殊寄存器,写特殊寄存器只能使用MSR,使用示例如下:
MSR CPSR, R0 @将R0中的数据复制到CPSR中,即CPSR=R0
A2.2.2 存储器访问指令
ARM不能直接访问存储器,比如RAM中的数据,ZYNQ中的寄存器就是RAM类型的,我们用汇编来配置ZYNQ寄存器的时候需要借助存储器访问指令,一般先将要配置的值写入到Rx(x=0~12)寄存器中,然后借助存储器访问指令将Rx中的数据写入到ZYNQ寄存器中。读取ZYNQ寄存器也是一样的,只是过程相反。常用的存储器访问指令有两种:LDR和STR,用法如下表所示:
表A2.2.2存储器访问指令


分别来详细的介绍一下如何使用这两个指令:
1、LDR指令
LDR主要用于从存储加载数据到寄存器Rx中,LDR也可以将一个立即数加载到寄存器Rx中,LDR加载立即数的时候要使用“=”,而不是“#”。在嵌入式开发中,LDR最常用的就是读取CPU的寄存器值,比如ZYNQ有个寄存器XGPIOPS_DIRM_OFFSET,其地址为0xE000A204,我们现在要读取这个寄存器中的数据,示例代码如下:
示例代码 LDR指令使用
1 LDR R0, = 0xE000A204 @将寄存器地址0xE000A204加载到R0中,即R0= 0xE000A204
2 LDR R1, [R0] @读取地址0xE000A204中的数据到R1寄存器中
上述代码就是读取寄存器XGPIOPS_DIRM_OFFSET中的值,读取到的寄存器值保存在R1寄存器中。
2、STR指令
LDR是从存储器读取数据,STR就是将数据写入到存储器中,同样以ZYNQ寄存器XGPIOPS_DIRM_OFFSET为例,现在我们要配置寄存器XGPIOPS_DIRM_OFFSET的值为0X2000002,示例代码如下:
示例代码 STR指令使用
1 LDR R0, = 0xE000A204 @将寄存器地址0xE000A204加载到R0中,即R0= 0xE000A204
2 LDR R1, =0X20000002 @R1保存要写入到寄存器的值,即R1=0X20000002
3 STR R1, [R0] @将R1中的值写入到R0中所保存的地址中
LDR和STR都是按照字进行读取和写入的,也就是操作的32位数据,如果要按照字节、半字进行操作的话可以在指令“LDR”后面加上B或H,比如按字节操作的指令就是LDRB和STRB,按半字操作的指令就是LDRH和STRH。
A2.2.3 压栈和出栈指令
我们通常会在A函数中调用B函数,当B函数执行完以后再回到A函数继续执行。要想在跳回A函数以后代码能够接着正常运行,那就必须在跳到B函数之前将当前处理器状态保存起来(就是保存R0~R15这些寄存器值),当B函数执行完成以后再用前面保存的寄存器值恢复R0~R15即可。保存R0~R15寄存器的操作就叫做现场保护,恢复R0~R15寄存器的操作就叫做恢复现场。在进行现场保护的时候需要进行压栈(入栈)操作,恢复现场就要进行出栈操作。压栈的指令为PUSH,出栈的指令为POP,PUSH和POP是一种多存储和多加载指令,也就是可以一次操作多个寄存器数据,它们利用当前的栈指针SP来生成地址,PUSH和POP的用法如下表所示:
表A2.2.3 压栈和出栈指令


假如我们现在要将R0~R3和R12这5个寄存器压栈,当前的SP指针指向0X80000000,处理器的堆栈是向下增长的,使用的汇编代码如下:
PUSH {R0~R3, R12} @将R0~R3和R12压栈
压栈完成以后的堆栈如下图所示:

图A2.2.1 压栈以后的堆栈

上图就是对R0~R3,R12进行压栈以后的堆栈示意图,此时的SP指向了0X7FFFFFEC,假如我们现在要再将LR进行压栈,汇编代码如下:
PUSH {LR} @将LR进行压栈
对LR进行压栈完成以后的堆栈模型如下图所示:

图A2.2.2 压栈以后的堆栈

上图就是分两步对R0~R3,R2和LR进行压栈以后的堆栈模型,如果我们要出栈的话就是使用如下代码:
POP {LR} @先恢复LR
POP {R0~R3,R12} @在恢复R0~R3,R12
出栈的就是从栈顶,也就是SP当前执行的位置开始,地址依次减小来提取堆栈中的数据到要恢复的寄存器列表中。PUSH和POP的另外一种写法是“STMFD SP!”和“LDMFD SP!”,因此上面的汇编代码可以改为:
示例代码 STMFD和LDMFD指令
  • 1 STMFD SP!,{R0~R3, R12} @R0~R3,R12入栈
  • 2 STMFD SP!,{LR} @LR入栈
  • 3
  • 4 LDMFD SP!, {LR} @先恢复LR
  • 5 LDMFD SP!, {R0~R3, R12} @在恢复R0~R3, R12

STMFD可以分为两部分:STM和FD,同理,LDMFD也可以分为LDM和FD。看到STM和LDM有没有觉得似曾相识,前面我们讲了LDR和STR,这两个是数据加载和存储指令,但是每次只能读写存储器中的一个数据。STM和LDM就是多加载和多存储,可以连续的读写存储器中的多个连续数据。
FD是Full Descending的缩写,即满递减的意思。根据ATPCS规则,ARM使用的FD类型的堆栈,SP指向最后一个入栈的数值,堆栈是由高地址向下增长的,也就是前面说的向下增长的堆栈,因此最常用的指令就是STMFD和LDMFD。STM和LDM的指令寄存器列表中编号小的对应低地址,编号高的对应高地址。
A2.2.4 跳转指令
有多种跳转操作,比如:
①、直接使用跳转指令B、BL、BX等。
③、直接向PC寄存器里面写入数据。
上述两种方法都可以完成跳转操作,但是一般常用的还是B、BL或BX,用法如下表:
表A2.2.4 跳转指令


我们重点来看一下B和BL指令,因为这两个是我们用的最多的,如果要在汇编中进行函数调用使用的就是B和BL指令:
1、B指令
这是最简单的跳转指令,B指令会将PC寄存器的值设置为跳转目标地址, 一旦执行B指令,ARM处理器就会立即跳转到指定的目标地址。如果要调用的函数不会再返回到原来的执行处,那就可以用B指令,如下示例:
示例代码 B指令示例
  • 1 _start:
  • 2
  • 3 ldr sp,=0X80200000 @设置栈指针
  • 4 b main @跳转到main函数

上述代码就是典型的在汇编中初始化C运行环境,然后跳转到C文件的main函数中运行,上述代码只是初始化了SP指针,有些处理器还需要做其他的初始化,比如初始化DDR等等。因为跳转到C文件以后再也不会回到汇编了,所以在第4行使用了B指令来完成跳转。
2、BL指令
BL指令相比B指令,在跳转之前会在寄存器LR(R14)中保存当前PC寄存器值,所以可以通过将LR寄存器中的值重新加载到PC中来继续从跳转之前的代码处运行,这是子程序调用一个基本但常用的手段。比如Cortex-A处理器的irq中断服务函数都是汇编写的,主要用汇编来实现现场的保护和恢复、获取中断号等。但是具体的中断处理过程都是C函数,所以就会存在汇编中调用C函数的问题。而且当C语言版本的中断处理函数执行完成以后是需要返回到irq汇编中断服务函数,因为还要处理其他的工作,一般是恢复现场。这个时候就不能直接使用B指令了,因为B指令一旦跳转就再也不会回来了,这个时候要使用BL指令,如是示例代码:
示例代码 BL指令示例
  • 1 push {r0, r1} @保存r0,r1
  • 2 cps #0x13 @进入SVC模式,允许其他中断再次进去
  • 3
  • 5 bl system_irqhandler @加载C语言中断处理函数到r2寄存器中
  • 6
  • 7 cps #0x12 @进入IRQ模式
  • 8 pop {r0, r1}
  • 9 str r0, [r1, #0X10] @中断执行完成,写EOIR

上述代码中第5行就是执行C语言版的中断处理函数,当处理完成以后是需要返回来继续执行下面的程序,所以使用了BL指令。
A2.2.5 算术运算指令


在嵌入式开发中最常会用的就是加减指令,乘除基本用不到。
A2.2.5 逻辑运算指令
我们用C语言进行CPU寄存器配置的时候常常需要用到逻辑运算符号,比如“&”、“|”等逻辑运算符。使用汇编语言的时候也可以使用逻辑运算指令,常用的运算指令用法如下表所示:
表A2.2.6 逻辑运算指令


逻辑运算指令都很好理解,ARM汇编就讲解到这里,本节主要讲解了一些最常用的指令,还有很多不常用的指令没有讲解,但是够我们学习用了。要想详细的学习ARM的所有指令请参考《ARM ArchitectureReference Manual ARMv7-A and ARMv7-R edition.pdf》和《ARM Cortex-A(armV7)编程手册V4.0.pdf》这两份文档。
参考文献
1.Xilinx. Zynq-7000 SoC Technical Reference Manual(ug585),2018
2.ARM. ARM Cortex -A Series Programmer’s Guide(Version: 4.0),2014
3.范书瑞,赵燕飞,高铁成. ARM处理器与C语言开发应用(第二版),北京:航空航天大学出版社,2013



0
分享淘帖 显示全部楼层

评论

高级模式
您需要登录后才可以回帖 登录 | 注册

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容图片侵权或者其他问题,请联系本站作侵删。 侵权投诉
发资料
关闭

站长推荐 上一条 /7 下一条

快速回复 返回顶部 返回列表