RTThread内核线程是如何切换的

1、背景

本文章主要说明 rtthread 内核线程是如何切换的，初学者刚从裸机开发接触 RTOS 时难免会有些不适应，明白这部分原理之后就会对 RTOS 有更深的理解。在学习内核线程切换原理之前需要有以下基础知识铺垫。本文以 arm 公司的 Cortex-M3 内核为例。

2、基础知识

CM3 拥有通用寄存器 R0-R15 以及一些特殊功能寄存器(中断屏蔽寄存器等等）

R0-R12 都是通用寄存器，用来临时存储程序运行时产生的数据

R13 这个寄存器存储堆栈指针，在 CM3 内核中一共有两个堆栈指针（MSP、PSP），于是 CM3 支持两个堆栈。在启动文件中定义的那个栈空间属于主栈，还有一个在我们创建线程时的栈属于线程栈。这两个栈空间不是同一个空间。

主堆栈指针（MSP）,这是默认的堆栈指针，在裸机开发中只是用这一个指针，由 OS 内核、中断服务程序以及所有需要特权访问的应用程序代码使用。

进程堆栈指针(PSP),用于常规的应用程序代码，比如线程。

R14 也叫做连接寄存器LR,在调用子程序时存储返回地址

R15 也叫做程序计数器 (PC，program counter)，因为 CM3 内部使用了指令流水线，PC 中存放的是当前指令的地址+4，也就是下一条指令的地址。

栈空间的定义：向下生长的栈。也就是说每次执行一个 push(压栈)命令，栈指针向下减小一个单元，每次执行pop命令，栈指针增加一个单元。如下图所示

3、代码分析
3.1 内核寄存器结构体定义
struct exception_stack_frame
{
rt_uint32_t r0;
rt_uint32_t r1;
rt_uint32_t r2;
rt_uint32_t r3;
rt_uint32_t r12;
rt_uint32_t lr;
rt_uint32_t pc;
rt_uint32_t psr;
};
struct stack_frame
{
/* r4 ~ r11 register */
rt_uint32_t r4;
rt_uint32_t r5;
rt_uint32_t r6;
rt_uint32_t r7;
rt_uint32_t r8;
rt_uint32_t r9;
rt_uint32_t r10;
rt_uint32_t r11;
struct exception_stack_frame exception_stack_frame;
};
struct exception_info
{
rt_uint32_t exc_return;
struct stack_frame stack_frame;
};

3.2 初始化线程栈
rt_uint8_t *rt_hw_stack_init(void *tentry, //线程函数入口地址
void *parameter,//线程函数参数
rt_uint8_t *stack_addr,//栈地址
void *texit)//线程退出时的函数地址
{
struct stack_frame *stack_frame;
rt_uint8_t *stk;
unsigned long i;

stk = stack_addr + sizeof(rt_uint32_t);//栈地址 + 4 个字节
stk = (rt_uint8_t )RT_ALIGN_DOWN((rt_uint32_t)stk, 8);//向下8个字节对齐
stk -= sizeof(struct stack_frame);//偏移16个字(164个字节)

stack_frame = (struct stack_frame )stk;//强制转换为 struct stack_frame 类型

/ init all register */
for (i = 0; i < sizeof(struct stack_frame) / sizeof(rt_uint32_t); i ++)
{
((rt_uint32_t )stack_frame)[i] = 0xdeadbeef;//初始化这16个字的空间为 0xdeadbeef
}
/ 初始化高8个字的内存空间 /
stack_frame->exception_stack_frame.r0 = (unsigned long)parameter; / r0 : argument /
stack_frame->exception_stack_frame.r1 = 0; / r1 /
stack_frame->exception_stack_frame.r2 = 0; / r2 /
stack_frame->exception_stack_frame.r3 = 0; / r3 /
stack_frame->exception_stack_frame.r12 = 0; / r12 /
stack_frame->exception_stack_frame.lr = (unsigned long)texit; / lr /
stack_frame->exception_stack_frame.pc = (unsigned long)tentry; / entry point, pc /
stack_frame->exception_stack_frame.psr = 0x01000000L; / PSR /

#if USE_FPU
stack_frame->flag = 0;
#endif / USE_FPU /

/ return task's current stack address */
return stk;
}

stack_addr 这个参数为当前线程栈的结束地址，也就是最高的地址。为什么是最高地址？原因是上面说过的栈空间的定义。

struct stack_frame 这个结构体的定义可不是胡乱定义的，里面是有顺序要求的。

stk -= sizeof(struct stack_frame);//偏移16个字(16*4个字节) 为何偏移这么多字节，因为这16个字的空间的每个地址要按照结构体成员变量的地址去存放，即 psr 要放到这个栈的最高地址，r4 在最低的地址。如图所示,此图出自野火。

3.3 执行线程切换
阅读这段代码之前得知道，cm3 内核执行中断或异常时，r0、r1、r2、r3、r12、lr、pc、psr，这些寄存器是自动压栈的。

rt_hw_context_switch PROC
EXPORT rt_hw_context_switch ;导出函数，此操作能够让C侧代码调用，C侧的第一个参数为当前线程栈sp的指针，第二个
;为将要执行的线程栈 sp 的指针
; set rt_thread_switch_interrupt_flag to 1
LDR r2, =rt_thread_switch_interrupt_flag;中断标志位 L2 = &rt_thread_switch_interrupt_flag
LDR r3, [r2];r3 = *r2也就是 r3 = rt_thread_switch_interrupt_flag
CMP r3, #1 ;判断rt_thread_switch_interrupt_flag 与 1是否相等
BEQ _reswitch ;相等跳转 _reswitch，当第2次执行线程切换时，rt_thread_switch_interrupt_flag被pendsv置0
;既然是第二次，所以当前线程具有上文所以要把sp存到rt_interrupt_from_thread，直接跳转_reswitch
;表示的是第一次切换线程，因为没有上文，所以直接跳到 _reswitch
MOV r3, #1 ;不等则置1
STR r3, [r2] ;rt_thread_switch_interrupt_flag = 1

LDR r2, =rt_interrupt_from_thread ; set rt_interrupt_from_thread
STR r0, [r2] ;rt_interrupt_from_thread = r0,&sp,当前线程sp的地址

_reswitch
LDR r2, =rt_interrupt_to_thread ; set rt_interrupt_to_thread
STR r1, [r2] ;rt_interrupt_to_thread = r1,&sp,将要只要的线程的sp的地址
;触发 pendsv 中断，线程切换的核心
LDR r0, =NVIC_INT_CTRL ; trigger the PendSV exception (causes context switch)
LDR r1, =NVIC_PENDSVSET
STR r1, [r0]
BX LR
ENDP

; r0 --> switch from thread stack
; r1 --> switch to thread stack
; psr, pc, lr, r12, r3, r2, r1, r0 are pushed into [from] stack
PendSV_Handler PROC
EXPORT PendSV_Handler

; 关闭所有中断以保护这一过程不被打断
MRS r2, PRIMASK
CPSID I

; rt_thread_switch_interrupt_flag 为 1时才继续接下来的操作，为0则跳转 pendsv_exit
LDR r0, =rt_thread_switch_interrupt_flag
LDR r1, [r0]
CBZ r1, pendsv_exit ; pendsv already handled

; 清楚中断标志位
MOV r1, #0x00
STR r1, [r0]
;判断 rt_interrupt_from_thread 是否为0，即是否是第一次切换线程，是0则跳转至switch_to_thread
LDR r0, =rt_interrupt_from_thread
LDR r1, [r0]
CBZ r1, switch_to_thread ; skip register save at the first time

MRS r1, psp ; 获取当前线程栈指针到r1中
STMFD r1!, {r4 - r11} ; 将r4 - r11寄存器中的值压入当前栈空间中
LDR r0, [r0]
STR r1, [r0] ; 把当前线程栈指针记录到 rt_interrupt_from_thread 中，即当前栈指针 sp 中

switch_to_thread
LDR r1, =rt_interrupt_to_thread;获取将要执行的栈的sp的地址
LDR r1, [r1]
LDR r1, [r1]

LDMFD r1!, {r4 - r11} ; 从将要执行的栈中弹出这个线程中的寄存器r4-r11
MSR psp, r1 ; 并把要执行的线程的栈指针给到 psp

pendsv_exit
; 恢复中断
MSR PRIMASK, r2
;由于cm3 内核发生中断时，堆栈指针使用的是msp,因此退出中断时，确保使用psp指针，实际操作就是对，lr寄存的位3进行置1就控制 ; 退出中断后使用psp中断
ORR lr, lr, #0x04
BX lr ;退出中断时使用psp指针
ENDP

通过解读 pendsv 中断代码我们知道，在进入 pendsv 中断前，r0、r1、r2、r3、r12、lr、pc、psr 这些寄存器已经自动压入了当前栈中。

当 pendsv 中断退出时，新的将要执行的线程的中断上下文(r0、r1、r2、r3、r12、lr、pc、ps)会自动的从这个线程栈中弹出，程序计数器 PC 就得到了这个将要执行的线程的pc值，这个线程中用到的其他寄存器的值也从这个新的线程栈中得到了(一部分手动pop,一部分自动pop)。

问题点一：我可以通过这个线程栈指针访问到R0~R15的值吗？

答案是肯定的，因为我们传入的 sp 地址就指向了线程栈地址的偏移16个字处，而内核压栈时，先自动压入 r0、r1、r2、r3、r12、lr、pc、psr 这8个字的空间，按照顺序压，先压psr，然后我们手动压 r4 - r11 ，也是按照顺序压，先压r11。此时这16个字的空间就被填满了，这也是为什么线程栈结构体中的成员变量的顺序不是随便填的(个人理解)。

问题点二：当我进入hard_fault 异常时，我能否获取到当前线程栈指针，从而拿到 pc 指针来判断程序出错的位置？

答案是可以的，rt-thread 已经帮我们重写了 hard_fault 服务程序。

原作者：TangZhenye

更多回帖

马占云

RTThread内核线程是如何切换的

相关帖子

请问rtthread线程切换时间大约多少？

请问rtthread线程切换时间大约多少？

鸿蒙内核源码之线程环境下的任务切换

鸿蒙内核源码分析之线程环境下的任务切换

鸿蒙内核分析：线程中断环境下的任务切换

进程切换与线程切换有啥区别

rtthread线程调度

线程管理之线程切换

【vscode 】用VSCODE 开发rtthread如何跳转到内核源码

RTThread线程切换流程图是不是有问题啊？

20万+工程师都在用，免费PCB检查工具