[文章]

鸿蒙内核源码分析(内存映射篇):虚拟地址与物理地址之间是如何映射的

2020-11-19 10:52:17  366 鸿蒙系统 内核 源码
分享
3
MMU的本质
虚拟地址(VA): 就是线性地址, 鸿蒙内存部分全是VA的身影, 是由编译器链接器在定位程序时分配的,每个应用程序都使用相同的虚拟内存地址空间,而这些虚拟内存地址空间实际上分别映射到不同的实际物理内存空间上。CPU只知道虚拟地址,向虚拟地址要数据,但在其保护模式下很悲催地址信号在路上被MMU拦截了,MMU把虚拟地址换成了物理地址,从而拿到了真正的数据。

物理地址(PA):程序的指令和常量数据,全局变量数据以及运行时动态申请内存所分配的实际物理内存存放位置。

MMU采用页表(page table)来实现虚实地址转换,页表项除了描述虚拟页到物理页直接的转换外,还提供了页的访问权限(读,写,可执行)和存储属性。 MMU的本质是拿虚拟地址的高位(20位)做文章,低12位是页内偏移地址不会变。也就是说虚拟地址和物理地址的低12位是一样的,本篇详细讲述MMU是如何变戏法的。

MMU是通过两级页表结构:L1和L2来实现映射功能的,鸿蒙内核当然也实现了这两级页表转换的实现。本篇是系列篇关于内存部分最满意的一篇,也是最不好理解的一篇, 强烈建议结合源码看, 鸿蒙内核源码注释中文版 【 Gitee仓 | CSDN仓 | Github仓 | Coding仓 】内存部分的注释已经基本完成 。

一级页表L1
L1页表将全部的4G地址空间划分为4096个1M的节,页表中每一项(页表项)32位,其内容是L2页表基地址或某个1M物理内存的基地址。虚拟地址的高12位用于对页表项定位,也就是4096个页面项的索引,L1页表的基地址,也叫转换表基地址,存放在CP15的C2(TTB)寄存器中,鸿蒙内核源码分析(内存汇编篇)中有详细的描述,自行翻看。
L1页表项有三种描述格式,鸿蒙源码如下:
  • /* L1 descriptor type */
  • #define MMU_DESCRIPTOR_L1_TYPE_INVALID                          (0x0 << 0)
  • #define MMU_DESCRIPTOR_L1_TYPE_PAGE_TABLE                     (0x1 << 0)
  • #define MMU_DESCRIPTOR_L1_TYPE_SECtiON                          (0x2 << 0)
  • #define MMU_DESCRIPTOR_L1_TYPE_MASK                             (0x3 << 0)
第一种:Fault(INVALID)页表项,表示对应虚拟地址未被映射,访问将产生一个数据中止异常。
第二种:PAGE_TABLE页表项,指向L2页表的页表项,意思就是把1M分成更多的页(256*4K)
第三种:SECTION页表项 ,指向1M节的页表项
4.jpg
页表项的最低二位[1:0],用于定义页表项的类型,section页表项对应1M的节,直接使用页表项的最高12位替代虚拟地址的高12位即可得到物理地址。还是直接看鸿蒙源码来的清晰,每一行都加了详细的注释。

LOS_ArchMmuQuery通过虚拟地址查询物理地址和flags
  • //通过虚拟地址查询物理地址
  • STATUS_T LOS_ArchMmuQuery(const LosArchMmu *archMmu, VADDR_T vaddr, PADDR_T *paddr, UINT32 *flags)
  • {//archMmu->virtTtb:转换表基地址
  •    PTE_T l1Entry = OsGetPte1(archMmu->virtTtb, vaddr);//获取PTE vaddr右移20位 得到L1描述子地址
  •    PTE_T l2Entry;
  •    PTE_T* l2Base = NULL;
  •     if (OsIsPte1Invalid(l1Entry)) {//判断L1描述子地址是否有效
  •         return LOS_ERRNO_VM_NOT_FOUND;//无效返回虚拟地址未查询到
  •     } else if (OsIsPte1Section(l1Entry)) {// section页表项: l1Entry低二位是否为 10
  •         if (paddr != NULL) {//物理地址 = 节基地址(section页表项的高12位) + 虚拟地址低20位
  •             *paddr = MMU_DESCRIPTOR_L1_SECTION_ADDR(l1Entry) + (vaddr & (MMU_DESCRIPTOR_L1_SMALL_SIZE - 1));
  •         }
  •         if (flags != NULL) {
  •             OsCvtSecAttsToFlags(l1Entry, flags);//获取虚拟内存的flag信息
  •         }
  •     } else if (OsIsPte1PageTable(l1Entry)) {//PAGE_TABLE页表项: l1Entry低二位是否为 01
  •         l2Base = OsGetPte2BasePtr(l1Entry);//获取L2转换表基地址
  •         if (l2Base == NULL) {
  •             return LOS_ERRNO_VM_NOT_FOUND;
  •         }
  •        l2Entry = OsGetPte2(l2Base, vaddr);//获取L2描述子地址
  •         if (OsIsPte2SmallPage(l2Entry) || OsIsPte2SmallPageXN(l2Entry)) {
  •             if (paddr != NULL) {//物理地址 = 小页基地址(L2页表项的高20位) + 虚拟地址低12位
  •                 *paddr = MMU_DESCRIPTOR_L2_SMALL_PAGE_ADDR(l2Entry) + (vaddr & (MMU_DESCRIPTOR_L2_SMALL_SIZE - 1));
  •             }
  •            if (flags != NULL) {
  •                 OsCvtPte2AttsToFlags(l1Entry, l2Entry, flags);//获取虚拟内存的flag信息
  •             }
  •         } else if (OsIsPte2LargePage(l2Entry)) {//鸿蒙目前暂不支持64K大页,未来手机版应该会支持。
  •             LOS_Panic("%s %d, large page unimplemented\n", __FUNCTION__, __LINE__);
  •         } else {
  •             return LOS_ERRNO_VM_NOT_FOUND;
  •         }
  •     }
  •     return LOS_OK;
  • }
这是鸿蒙内核对地址使用最频繁的功能,通过虚拟地址得到物理地址和flag信息,看下哪些地方会调用到它。
5.png

二级页表L2
L1页表项表示1M的地址范围,L2把1M分成更多的小页,鸿蒙内核 一页按4K算,所以被分成 256个小页。
L2页表中包含256个页表项,每个32位(4个字节),L2页表需要 256*4 = 1K的空间,必须按1K对齐,每个L2页表项将4K的虚拟内存地址转换为物理地址,每个L2页面项都给出了一个4K的页基地址。
L2页表项有三种格式:
  • /* L2 descriptor type */
  • #define MMU_DESCRIPTOR_L2_TYPE_INVALID                          (0x0 << 0)
  • #define MMU_DESCRIPTOR_L2_TYPE_LARGE_PAGE                     (0x1 << 0)
  • #define MMU_DESCRIPTOR_L2_TYPE_SMALL_PAGE                    (0x2 << 0)
  • #define MMU_DESCRIPTOR_L2_TYPE_SMALL_PAGE_XN              (0x3 << 0)
  • #define MMU_DESCRIPTOR_L2_TYPE_MASK                             (0x3 << 0)
第一种:Fault(INVALID)页表项,表示对应虚拟地址未被映射,访问将产生一个数据中止异常。
第二种:大页表项,包含一个指向64K页的指针,但鸿蒙内核并没有实现大页表的支持,给出了未实现的提示
  • if (OsIsPte2LargePage(l2Entry)) {
  •             LOS_Panic("%s %d, large page unimplemented\n", __FUNCTION__, __LINE__);
  •         }
第三种:小页表项,包含一个指向4K页的指针。
6.jpg

映射初始化的过程
先看调用和被调用的关系
7.png
  • //启动映射初始化
  • VOID OsInitMappingStartUp(VOID)
  • {
  •    OsArmInvalidateTlbBarrier();//使TLB失效
  •     OsSwitchTmpTTB();//切换到临时TTB
  •     OsSetKSectionAttr();//设置内核段(text,rodata,bss)映射
  •     OsArchMmuInitPerCPU();//初始化CPU与mmu相关信息
  • }
干脆利落,调用了四个函数,其中三个在鸿蒙内核源码分析(内存汇编篇)有涉及,不展开讲,这里说OsSetKSectionAttr。它实现了内核空间各个区的映射,内核本身也是程序,鸿蒙把内核空间在物理内存上就独立开来了,也就是说在物理内存上有一段区域是只给内核空间享用的,从根上就把内核和APP 空间隔离了,里面放的是内核的重要数据(包括代码,常量和全局变量),具体看代码,代码很长,整个函数全贴出来了,都加上了注释。

OsSetKSectionAttr 内核空间的设置和映射
  • typedef struct ArchMmuInitMapping {
  •     PADDR_T phys;//物理地址
  •     VADDR_T virt;//虚拟地址
  •     size_t  size;//大小
  •     unsigned int flags;//标识 读/写/.. VM_MAP_REGION_FLAG_PERM_*
  •     const char *name;//名称
  • } LosArchMmuInitMapping;

  • VADDR_T *OsGFirstTableGet()
  • {
  •     return (VADDR_T *)g_firstPageTable;//UINT8 g_firstPageTable[MMU_DESCRIPTOR_L1_SMALL_ENTRY_NUMBERS]
  • }
  • //设置内核空间段属性,可看出内核空间是固定映射到物理地址
  • STATIC VOID OsSetKSectionAttr(VOID)
  • {
  •     /* every section should be page aligned */
  •     UINTPTR textStart = (UINTPTR)&__text_start;//代码段开始位置
  •     UINTPTR textEnd = (UINTPTR)&__text_end;//代码段结束位置
  •     UINTPTR rodataStart = (UINTPTR)&__rodata_start;//常量只读段开始位置
  •     UINTPTR rodataEnd = (UINTPTR)&__rodata_end;//常量只读段结束位置
  •     UINTPTR ramDataStart = (UINTPTR)&__ram_data_start;//全局变量段开始位置
  •     UINTPTR bssEnd = (UINTPTR)&__bss_end;//bss结束位置
  •     UINT32 bssEndBoundary = ROUNDUP(bssEnd, MB);
  •     LosArchMmuInitMapping mmuKernelMappings[] = {
  •         {

  •             .phys = SYS_MEM_BASE + textStart - KERNEL_VMM_BASE,//映射物理内存位置
  •             .virt = textStart,//内核代码区
  •             .size = ROUNDUP(textEnd - textStart, MMU_DESCRIPTOR_L2_SMALL_SIZE),//代码区大小
  •             .flags = VM_MAP_REGION_FLAG_PERM_READ | VM_MAP_REGION_FLAG_PERM_EXECUTE,//代码段可读,可执行
  •             .name = "kernel_text"
  •         },
  •         {
  •             .phys = SYS_MEM_BASE + rodataStart - KERNEL_VMM_BASE,//映射物理内存位置
  •             .virt = rodataStart,//内核常量区
  •             .size = ROUNDUP(rodataEnd - rodataStart, MMU_DESCRIPTOR_L2_SMALL_SIZE),//4K对齐
  •             .flags = VM_MAP_REGION_FLAG_PERM_READ,//常量段只读
  •             .name = "kernel_rodata"
  •         },
  •         {
  •             .phys = SYS_MEM_BASE + ramDataStart - KERNEL_VMM_BASE,//映射物理内存位置
  •             .virt = ramDataStart,
  •             .size = ROUNDUP(bssEndBoundary - ramDataStart, MMU_DESCRIPTOR_L2_SMALL_SIZE),
  •             .flags = VM_MAP_REGION_FLAG_PERM_READ | VM_MAP_REGION_FLAG_PERM_WRITE,//全局变量区可读可写
  •             .name = "kernel_data_bss"
  •         }
  •     };
  •     LosVmSpace *kSpace = LOS_GetKVmSpace();//获取内核空间
  •     status_t status;
  •     UINT32 length;
  •     paddr_t oldTtPhyBase;
  •     int i;
  •     LosArchMmuInitMapping *kernelMap = NULL;//内核映射
  •     UINT32 kmallocLength;

  •     /* use second-level mapping of default READ and WRITE */
  •     kSpace->archMmu.virtTtb = (PTE_T *)g_firstPageTable;//__attribute__((section(".bss.prebss.translation_table"))) UINT8 g_firstPageTable[MMU_DESCRIPTOR_L1_SMALL_ENTRY_NUMBERS];
  •     kSpace->archMmu.physTtb = LOS_PaddrQuery(kSpace->archMmu.virtTtb);//通过TTB虚拟地址查询TTB物理地址
  •     status = LOS_ArchMmuUnmap(&kSpace->archMmu, KERNEL_VMM_BASE,
  •                                (bssEndBoundary - KERNEL_VMM_BASE) >> MMU_DESCRIPTOR_L2_SMALL_SHIFT);//解绑 bssEndBoundary - KERNEL_VMM_BASE 映射
  •     if (status != ((bssEndBoundary - KERNEL_VMM_BASE) >> MMU_DESCRIPTOR_L2_SMALL_SHIFT)) {//解绑失败
  •         VM_ERR("unmap faiLED, status: %d", status);
  •         return;
  •     }
  •         //映射 textStart - KERNEL_VMM_BASE 区
  •     status = LOS_ArchMmuMap(&kSpace->archMmu, KERNEL_VMM_BASE, SYS_MEM_BASE,
  •                              (textStart - KERNEL_VMM_BASE) >> MMU_DESCRIPTOR_L2_SMALL_SHIFT,
  •                              VM_MAP_REGION_FLAG_PERM_READ | VM_MAP_REGION_FLAG_PERM_WRITE |
  •                              VM_MAP_REGION_FLAG_PERM_EXECUTE);
  •     if (status != ((textStart - KERNEL_VMM_BASE) >> MMU_DESCRIPTOR_L2_SMALL_SHIFT)) {
  •         VM_ERR("mmap failed, status: %d", status);
  •         return;
  •     }

  •     length = sizeof(mmuKernelMappings) / sizeof(LosArchMmuInitMapping);
  •     for (i = 0; i < length; i++) {//对mmuKernelMappings一一映射好
  •         kernelMap = &mmuKernelMappings;

  •         status = LOS_ArchMmuMap(&kSpace->archMmu, kernelMap->virt, kernelMap->phys,
  •                                  kernelMap->size >> MMU_DESCRIPTOR_L2_SMALL_SHIFT, kernelMap->flags);
  •         if (status != (kernelMap->size >> MMU_DESCRIPTOR_L2_SMALL_SHIFT)) {
  •             VM_ERR("mmap failed, status: %d", status);
  •             return;
  •         }
  •         LOS_VmSpaceReserve(kSpace, kernelMap->size, kernelMap->virt);//保留区
  •     }
  •         //将剩余空间映射好
  •     kmallocLength = KERNEL_VMM_BASE + SYS_MEM_SIZE_DEFAULT - bssEndBoundary;
  •     status = LOS_ArchMmuMap(&kSpace->archMmu, bssEndBoundary,
  •                              SYS_MEM_BASE + bssEndBoundary - KERNEL_VMM_BASE,
  •                              kmallocLength >> MMU_DESCRIPTOR_L2_SMALL_SHIFT,
  •                              VM_MAP_REGION_FLAG_PERM_READ | VM_MAP_REGION_FLAG_PERM_WRITE);
  •     if (status != (kmallocLength >> MMU_DESCRIPTOR_L2_SMALL_SHIFT)) {
  •         VM_ERR("unmap failed, status: %d", status);
  •         return;
  •     }
  •     LOS_VmSpaceReserve(kSpace, kmallocLength, bssEndBoundary);

  •     /* we need free tmp ttbase */
  •     oldTtPhyBase = OsArmReadTtbr0();//读取TTB值
  •     oldTtPhyBase = oldTtPhyBase & MMU_DESCRIPTOR_L2_SMALL_FRAME;
  •     OsArmWriteTtbr0(kSpace->archMmu.physTtb | MMU_TTBRx_FLAGS);//内核页表基地址写入CP15 c2(TTB寄存器)
  •      ISB;

  •     /* we changed page table entry, so we need to clean TLB here */
  •     OsCleanTLB();//清空TLB缓冲区

  •     (VOID)LOS_MemFree(m_aucSysMem0, (VOID *)(UINTPTR)(oldTtPhyBase - SYS_MEM_BASE + KERNEL_VMM_BASE));//释放内存池
  • }
LOS_ArchMmuMap 生成L1,L2页表项,实现映射的过程
mmu的map 就是生成L1,L2页表项的过程,以供虚实地址的转换使用,还是直接看代码吧,代码说明一切!
  • //所谓的 map 就是 生成L1,L2页表项的过程
  • status_t LOS_ArchMmuMap(LosArchMmu *archMmu, VADDR_T vaddr, PADDR_T paddr, size_t count, UINT32 flags)
  • {
  •      PTE_T l1Entry
  •     UINT32 saveCounts = 0;
  •     INT32 mapped = 0;
  •     INT32 checkRst;

  •     checkRst = OsMapParamCheck(flags, vaddr, paddr);//检查参数
  •     if (checkRst < 0) {
  •         return checkRst;
  •     }

  •     /* see what kind of mapping we can use */
  •     while (count > 0) {
  •         if (MMU_DESCRIPTOR_IS_L1_SIZE_ALIGNED(vaddr) && //虚拟地址和物理地址对齐 0x100000(1M)时采用
  •             MMU_DESCRIPTOR_IS_L1_SIZE_ALIGNED(paddr) && //section页表项格式
  •             count >= MMU_DESCRIPTOR_L2_NUMBERS_PER_L1) { //MMU_DESCRIPTOR_L2_NUMBERS_PER_L1 = 0x100
  •             /* compute the arch flags for L1 sections cache, r ,w ,x, domain and type */
  •             saveCounts = OsMapSection(archMmu, flags, &vaddr, &paddr, &count);//生成L1 section类型页表项并保存
  •         } else {
  •             /* have to use a L2 mapping, we only allocate 4KB for L1, support 0 ~ 1GB */
  •             l1Entry = OsGetPte1(archMmu->virtTtb, vaddr);//获取L1页面项
  •             if (OsIsPte1Invalid(l1Entry)) {//L1 fault页面项类型
  •                 OsMapL1PTE(archMmu, &l1Entry, vaddr, flags);//生成L1 page table类型页表项并保存
  •                 saveCounts = OsMapL2PageContinous(l1Entry, flags, &vaddr, &paddr, &count);//生成L2 页表项目并保存
  •             } else if (OsIsPte1PageTable(l1Entry)) {//L1 page table页面项类型
  •                 saveCounts = OsMapL2PageContinous(l1Entry, flags, &vaddr, &paddr, &count);//生成L2 页表项目并保存
  •             } else {
  •                 LOS_Panic("%s %d, unimplemented tt_entry %x\n", __FUNCTION__, __LINE__, l1Entry);
  •             }
  •         }
  •         mapped += saveCounts;
  •     }

  •     return mapped;
  • }

  • STATIC UINT32 OsMapL2PageContinous(PTE_T pte1, UINT32 flags, VADDR_T *vaddr, PADDR_T *paddr, UINT32 *count)
  • {
  •     PTE_T *pte2BasePtr = NULL;
  •     UINT32 archFlags;
  •     UINT32 saveCounts;

  •     pte2BasePtr = OsGetPte2BasePtr(pte1);
  •     if (pte2BasePtr == NULL) {
  •         LOS_Panic("%s %d, pte1 %#x error\n", __FUNCTION__, __LINE__, pte1);
  •     }

  •     /* compute the arch flags for L2 4K pages */
  •     archFlags = OsCvtPte2FlagsToAttrs(flags);
  •     saveCounts = OsSavePte2Continuous(pte2BasePtr, OsGetPte2Index(*vaddr), *paddr | archFlags, *count);
  •     *paddr += (saveCounts << MMU_DESCRIPTOR_L2_SMALL_SHIFT);
  •     *vaddr += (saveCounts << MMU_DESCRIPTOR_L2_SMALL_SHIFT);
  •     *count -= saveCounts;
  •     return saveCounts;
  • }

8.png
OsMapL2PageContinous 没有加注释,希望你别太懒,赶紧动起来,到这里应该都能看懂了!最好能结合 鸿蒙内核源码分析(内存汇编篇)一起看理解会更深透。

本文来源:图解鸿蒙源码逐行注释分析
李晓鹏 2020-11-19 18:03:47
讲的很不错,大伙感紧学习起来了
回复

举报

尹向旭 2020-11-23 17:53:24
是什么软件生成的图解???
回复

举报

评论

您需要登录后才可以回帖 登录 | 注册

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容图片侵权或者其他问题,请联系本站作侵删。 侵权投诉
发文章