Linux 内核页表和进程页表

2016/12/23 16:17
阅读数 3.5K

初学内核时,经常被“内核页表”和“进程页表”搞晕,不知道这到底是个啥东东,跟我们平时理解的页表有什么关系。

 

内核页表:即书上说的主内核页表,在内核中其实就是一段内存,存放在主内核页全局目录init_mm.pgd(swapper_pg_dir)中,硬件并不直接使用。

 

进程页表:每个进程自己的页表,放在进程自身的页目录task_struct.pgd中。

在保护模式下,从硬件角度看,其运行的基本对象为“进程”(或线程),而寻址则依赖于“进程页表”,在进程调度而进行上下文切换时,会进行页表的切换:即将新进程的pgd(页目录)加载到CR3寄存器中。从这个角度看,其实是完全没有用到“内核页表”的,那么“内核页表”有什么用呢?跟“进程页表”有什么关系呢?

 

1、内核页表中的内容为所有进程共享,每个进程都有自己的“进程页表”,“进程页表”中映射的线性地址包括两部分:

 

用户态

内核态

 

其中,内核态地址对应的相关页表项,对于所有进程来说都是相同的(因为内核空间对所有进程来说都是共享的),而这部分页表内容其实就来源于“内核页表”,即每个进程的“进程页表”中内核态地址相关的页表项都是“内核页表”的一个拷贝。

 

2、“内核页表”由内核自己维护并更新,在vmalloc区发生page fault时,将“内核页表”同步到“进程页表”中。以32位系统为例,内核页表主要包含两部分:

 

线性映射区

vmalloc区

 

其中,线性映射区即通过TASK_SIZE偏移进行映射的区域,对32系统来说就是0-896M这部分区域,映射对应的虚拟地址区域为TASK_SIZE-TASK_SIZE+896M。这部分区域在内核初始化时就已经完成映射,并创建好相应的页表,即这部分虚拟内存区域不会发生page fault。

 

vmalloc区,为896M-896M+128M,这部分区域用于映射高端内存,有三种映射方式:vmalloc、固定、临时,这里就不像述了。

 

以vmalloc为例(最常使用),这部分区域对应的线性地址在内核使用vmalloc分配内存时,其实就已经分配了相应的物理内存,并做了相应的映射,建立了相应的页表项,但相关页表项仅写入了“内核页表”,并没有实时更新到“进程页表中”,内核在这里使用了“延迟更新”的策略,将“进程页表”真正更新推迟到第一次访问相关线性地址,发生page fault时,此时在page fault的处理流程中进行“进程页表”的更新:

 

/*

     * 缺页地址位于内核空间。并不代表异常发生于内核空间,有可能是用户

     * 态访问了内核空间的地址。

     */

    if (unlikely(fault_in_kernel_space(address))) {

        if (!(error_code & (PF_RSVD | PF_USER | PF_PROT))) {

            //检查发生缺页的地址是否在vmalloc区,是则进行相应的处理

            if (vmalloc_fault(address) >= 0)

                return;

 

/*

  * 对于发生缺页异常的指针位于vmalloc区情况的处理,主要是将

  * 主内核页表向当前进程的内核页表同步。

  */

static noinline __kprobes int vmalloc_fault(unsigned long address)

{

    unsigned long pgd_paddr;

    pmd_t *pmd_k;

    pte_t *pte_k;

 

    /* Make sure we are in vmalloc area: */

    /* 区域检查 */

    if (!(address >= VMALLOC_START && address < VMALLOC_END))

        return -1;

 

    WARN_ON_ONCE(in_nmi());

 

    /*

     * Synchronize this task's top level page-table

     * with the 'reference' page table.

     *

     * Do _not_ use "current" here. We might be inside

     * an interrupt in the middle of a task switch..

     */

     /*获取pgd(最顶级页目录)地址,直接从CR3寄存器中读取。

     *不要通过current获取,因为缺页异常可能在上下文切换的过程中发生,

     *此时如果通过current获取,则可能会出问题*/

    pgd_paddr = read_cr3();

    //从主内核页表中,同步vmalloc区发生缺页异常地址对应的页表

    pmd_k = vmalloc_sync_one(__va(pgd_paddr), address);

    if (!pmd_k)

        return -1;

    //如果同步后,相应的PTE还不存在,则说明该地址有问题了

    pte_k = pte_offset_kernel(pmd_k, address);

    if (!pte_present(*pte_k))

        return -1;

 

    return 0;

}

来源:humjb_1983

链接:http://blog.chinaunix.net/uid-14528823-id-4334619.html

展开阅读全文
打赏
0
0 收藏
分享
加载中
更多评论
打赏
0 评论
0 收藏
0
分享
返回顶部
顶部