位置: IT常识 - 正文

Linux内核学习笔记——页表的那些事。(《linux内核分析》)

编辑:rootadmin
Linux内核学习笔记——页表的那些事。 目录页表什么时候创建内核页表变化什么时候更新到用户页表源码分析常见问题解答问题一:页表到底是保存在内核空间中还是用户空间中?问题2:页表访问,软件是不是会频繁陷入内核?问题3:内存申请,软件是不是会频繁陷入内核创建新页表条目问题4:那内核页表和普通的页表到底有什么区别?

推荐整理分享Linux内核学习笔记——页表的那些事。(《linux内核分析》),希望有所帮助,仅作参考,欢迎阅读内容。

文章相关热门搜索词:linux内核原理与实现,linux内核教程,linux内核分析及应用,深入了解linux内核,深入理解linux内核 知乎,深入了解linux内核,《linux内核分析》,深入理解linux内核 知乎,内容如对您有帮助,希望把文章链接给更多的朋友!

接上两文,本文补充一下内核页表和用户页表创建、更新时机说明。 Linux内核学习笔记——内核页表隔离KPTI机制 Linux内核学习笔记——内核页表隔离KPTI机制(源码分析)

KPTI中每个进程有两套页表——内核态页表与用户态页表(两个地址空间)。

内核态页表只能在内核态下访问,可以创建到内核和用户的映射(不过用户空间受SMAP和SMEP保护)。

内核页表:即书上说的主内核页表,在内核中其实就是一段内存,存放在主内核页全局目录init_mm.pgd(swapper_pg_dir)中,硬件并不直接使用。

进程页表:每个进程自己的页表,放在进程自身的页目录task_struct.pgd中。

在保护模式下,从硬件角度看,其运行的基本对象为“进程”(或线程),而寻址则依赖于“进程页表”,在进程调度而进行上下文切换时,会进行页表的切换:即将新进程的pgd(页目录)加载到CR3寄存器中。从这个角度看,其实是完全没有用到“内核页表”的,那么“内核页表”有什么用呢?跟“进程页表”有什么关系呢?

页表什么时候创建

内核页表中的内容为所有进程共享,每个进程都有自己的“进程页表”,“进程页表”中映射的线性地址包括两部分:

用户态内核态 其中,内核态地址对应的相关页表项,对于所有进程来说都是相同的(因为内核空间对所有进程来说都是共享的),而这部分页表内容其实就来源于“内核页表”,即每个进程的“进程页表”中内核态地址相关的页表项都是“内核页表”的一个拷贝(进程创建时候就产生了)。内核页表变化什么时候更新到用户页表

“内核页表”由内核自己维护并更新,在vmalloc区发生page fault时,将“内核页表”同步到“进程页表”中。以32位系统为例,内核页表主要包含两部分:

线性映射区vmalloc区Linux内核学习笔记——页表的那些事。(《linux内核分析》)

其中,线性映射区即通过TASK_SIZE偏移进行映射的区域,对32系统来说就是0-896M这部分区域,映射对应的虚拟地址区域为TASK_SIZE~TASK_SIZE+896M。这部分区域在内核初始化时就已经完成映射,并创建好相应的页表,即这部分虚拟内存区域不会发生page fault。

vmalloc区,为896M~896M+128M,这部分区域用于映射高端内存,有三种映射方式:vmalloc、固定、临时,这里就不详细展开了。

以vmalloc为例(最常使用),这部分区域对应的线性地址在内核使用vmalloc分配内存时,其实就已经分配了相应的物理内存,并做了相应的映射,建立了相应的页表项,但相关页表项仅写入了“内核页表”,并没有实时更新到“进程页表中”,内核在这里使用了“延迟更新”的策略,将“进程页表”真正更新推迟到第一次访问相关线性地址,发生page fault时,此时在page fault的处理流程中进行“进程页表”的更新。

源码分析/* * 缺页地址位于内核空间。并不代表异常发生于内核空间,有可能是用户 * 态访问了内核空间的地址。 */ if (unlikely(fault_in_kernel_space(address))) { if (!(error_code & (PF_RSVD | PF_USER | PF_PROT))) { //检查发生缺页的地址是否在vmalloc区,是则进行相应的处理 if (vmalloc_fault(address) >= 0) return;/* * 对于发生缺页异常的指针位于vmalloc区情况的处理,主要是将 * 主内核页表向当前进程的内核页表同步。 */static noinline __kprobes int vmalloc_fault(unsigned long address){ unsigned long pgd_paddr; pmd_t *pmd_k; pte_t *pte_k; /* Make sure we are in vmalloc area: */ /* 区域检查 */ if (!(address >= VMALLOC_START && address < VMALLOC_END)) return -1; WARN_ON_ONCE(in_nmi()); /* * Synchronize this task's top level page-table * with the 'reference' page table. * * Do _not_ use "current" here. We might be inside * an interrupt in the middle of a task switch.. */ /*获取pgd(最顶级页目录)地址,直接从CR3寄存器中读取。 *不要通过current获取,因为缺页异常可能在上下文切换的过程中发生, *此时如果通过current获取,则可能会出问题*/ pgd_paddr = read_cr3(); //从主内核页表中,同步vmalloc区发生缺页异常地址对应的页表 pmd_k = vmalloc_sync_one(__va(pgd_paddr), address); if (!pmd_k) return -1; //如果同步后,相应的PTE还不存在,则说明该地址有问题了 pte_k = pte_offset_kernel(pmd_k, address); if (!pte_present(*pte_k)) return -1; return 0;}常见问题解答问题一:页表到底是保存在内核空间中还是用户空间中?

创建和删除页表的确是在内核空间操作的。页表不能在用户空间进行操作一点都不奇怪,你要知道页表的作用不仅仅是虚拟地址到物理地址的映射,还有关键的权限访问控制和页面属性的记录。下图是armv8中level 1的页表格式,类似于x86中的PUD的结构: 可以看到该页表中只有"Outlook block address"是在表示下一级页表的地址,"Upper attributes"和"Lower attributes"是内核空间用到权限的控制位和页属性标志。

问题2:页表访问,软件是不是会频繁陷入内核?

这个需要结合场景分析。访问页表是否会陷入内核,这要看你是:

CPU地址翻译的过程中的页表访问;增加修改页表项。

如果是第一种,CPU地址翻译,那么这种访问是硬件完成的,整个过程不需要代码参与,没有任何性能上的损失。

如果是第二种,是会慢一些。这种慢是为了安全,如果页表在用户空间,那么用户就可能自己修改页表,映射任意的内存地址,访问任何内存,甚至是直接操作硬件,进程间、内核的隔离保护就失去了意义。

问题3:内存申请,软件是不是会频繁陷入内核创建新页表条目

你以为在用户进程中分配内存的时候,就马上通过系统调用陷入内核,然后进行页表操作吗?这个理解是不对的。

应用程序虽然可能频繁的malloc或者free,但在页表层面上,并不会频繁的创建、删除页表项,主要原因是,malloc/free操作的接口都是C库的接口,在C库里,还有另外一层次的封装,来保证不会频繁的提交页表的操作申请。

内核如今已经发展的很成熟了,当然不会这么傻。在你兴高采烈的分配好一块内存后,内核只是给你找了一块独一无二的虚拟内存空间,并没有映射到物理内存,所以根本没有页表的操作。只有你真正用到你的内存时,MMU发现无法进行虚拟内存到物理内存的转换,只好抛出page fault异常,然后进入内核进行物理内存的分配过程,接着就给你把页表创建好了,这个整个过程叫做惰性分配。

更重要的是,其实libc库在进程创建的时候,就已经把堆空间用内存池的方式管理起来,在进程分配小于128kb的内存时,根本不需要内核进行任何操作,因为堆这个段的虚拟内存早就映射好了物理内存。

问题4:那内核页表和普通的页表到底有什么区别?

对于所有进程来说它们页表中的内核空间页表部分都是一模一样的,它们都是从1号进程的init_mm结构中copy的,只有用户空间的页表不尽相同。用户空间的页表是用来进行不同进程地址空间隔离的,所以相同的虚拟地址可以映射到不同的物理地址,当然一般情况下这也是必须的,而内核只有一个。

本文链接地址:https://www.jiuchutong.com/zhishi/299210.html 转载请保留说明!

上一篇:vue2计算属性computed(vue2计算属性和vue3的计算属性的区别)

下一篇:微信小程序获取当前的位置(微信小程序获取地理位置)

  • 笔记本无线网卡怎么开启(笔记本无线网卡设置)(笔记本无线网卡坏了怎么办)

    笔记本无线网卡怎么开启(笔记本无线网卡设置)(笔记本无线网卡坏了怎么办)

  • oppo手机耳机模式怎么关闭(oppo手机耳机模式在哪里设置)

    oppo手机耳机模式怎么关闭(oppo手机耳机模式在哪里设置)

  • 探探这个软件那年出的(探探这个软件好吗)

    探探这个软件那年出的(探探这个软件好吗)

  • 电脑怎样新建excel表格(电脑怎样新建桌面)

    电脑怎样新建excel表格(电脑怎样新建桌面)

  • yoosee error啥意思(error occurs什么意思)

    yoosee error啥意思(error occurs什么意思)

  • 小米打印机为啥连接不上(小米打印机为啥显示连不上互联网)

    小米打印机为啥连接不上(小米打印机为啥显示连不上互联网)

  • 网易云会员有什么用(网易云会员有什么权限)

    网易云会员有什么用(网易云会员有什么权限)

  •   卖家拒绝退款买家超时未处理(卖家拒绝退款)

      卖家拒绝退款买家超时未处理(卖家拒绝退款)

  • 开通5g套餐怎么不显示5g信号(我已经办理了5g套餐怎么开启)

    开通5g套餐怎么不显示5g信号(我已经办理了5g套餐怎么开启)

  • 小米电动牙刷充电指示灯什么颜色(小米电动牙刷充电灯不亮)

    小米电动牙刷充电指示灯什么颜色(小米电动牙刷充电灯不亮)

  • 腾讯大王卡看快手免流量吗(腾讯大王卡看快手放映厅免流量吗)

    腾讯大王卡看快手免流量吗(腾讯大王卡看快手放映厅免流量吗)

  • 电脑设置高性能的利弊(电脑设置高性能模式开不了机)

    电脑设置高性能的利弊(电脑设置高性能模式开不了机)

  • 荣耀30是华为的吗(荣耀30是华为的吗怎么样)

    荣耀30是华为的吗(荣耀30是华为的吗怎么样)

  • a1549是苹果几(苹果手机a1549是苹果几)

    a1549是苹果几(苹果手机a1549是苹果几)

  • 抖音为什么加载不出来(抖音为什么加载不了自己的相册)

    抖音为什么加载不出来(抖音为什么加载不了自己的相册)

  • itime是什么意思

    itime是什么意思

  • 腾讯超级视频影视vip什么意思(腾讯超级视频影视vip可以看腾讯体育吗)

    腾讯超级视频影视vip什么意思(腾讯超级视频影视vip可以看腾讯体育吗)

  • 小米6充电是多少w(小米6充电是多少瓦)

    小米6充电是多少w(小米6充电是多少瓦)

  • pagedown键的作用(page down键的功能)

    pagedown键的作用(page down键的功能)

  • hdfs默认block size的大小是(hdfs默认block大小是)

    hdfs默认block size的大小是(hdfs默认block大小是)

  • 如何取消微信头像(如何取消微信头像拍一拍)

    如何取消微信头像(如何取消微信头像拍一拍)

  • 小米蓝牙耳机防水等级是多少(小米蓝牙耳机防伪码)

    小米蓝牙耳机防水等级是多少(小米蓝牙耳机防伪码)

  • 遥控车遥控器怎么对信号源(遥控车遥控器怎么打开)

    遥控车遥控器怎么对信号源(遥控车遥控器怎么打开)

  • 详解Inception结构:从Inception v1到Xception(critical_section 结构)

    详解Inception结构:从Inception v1到Xception(critical_section 结构)

  • 民办非企业收到捐赠固定资产
  • 购买材料,收回会计分录
  • 制造费用科目一定无余额
  • 存货核算的内容是什么
  • 税控盘当月不抵扣怎么申报
  • 蓝字发票有认证的吗
  • 工资结算单属于通用凭证吗
  • 企业所得税汇算清缴申报表
  • 预缴增值税是否要预缴印花税
  • 公司支票可以存到个人账户吗
  • 买鼠标去哪买
  • 开物流公司能挣多少钱
  • 外籍人员的个人所得税怎么算
  • 营改增的项目
  • 案例分析正当防卫
  • 电子银行承兑汇票到期选择线上清算
  • 结算会计和核算会计哪个更好
  • 非同一控制下合并报表编制
  • 交割单会出错吗
  • 项目的投入资金预算表
  • 代买车船税怎么挣钱
  • cpu性能天梯图2023年3月
  • 索尼vpcea200c笔记本
  • 如何配置无线路由器参数
  • appdata文件夹可以改名吗
  • win11自动更新卡在94%
  • 对公账户代扣
  • 外籍人员个人所得税计算
  • 废品损失科目的期末余额在借方表示什么?
  • 贝特希金斯
  • 浅谈中国式现代化3000字论文
  • 约当产量法的会计分录
  • 固定资产清理税务处理
  • torch训练模型
  • php的lamp
  • php过滤sql注入
  • 前端开发常用技术
  • load命令怎么用
  • sar参数设置4个数
  • 存货盘盈的账务处理入什么费用
  • 应交税费会计分录怎么做明细科目
  • 购入固定资产计入应付账款还是其他应付款
  • sql数据库使用基本原理
  • 股东可以领取工资吗
  • 工会经费与教育经费比例
  • 不动产租赁需要资质吗
  • mysql5.5创建用户
  • 交强险必须要买嘛
  • 两个独立核算单位可以共用一个账户吗
  • 促销费会计分录怎么写
  • 核定征收适用于什么税率
  • 房租预付款会计分录
  • 非货币性资产交换换入资产的入账价值
  • 付款金额与收到款的关系
  • 销售退货和销售换货的区别
  • 公路工程投标保证金
  • 财务报表的一般构成要素
  • 什么是批发零售市场
  • 农村会计记账实例
  • win7桌面右键菜单设置
  • ubuntu-server
  • ubuntu屏幕突然变大
  • mac取消开机启动项
  • Win7注册表怎么恢复
  • win xp怎么样
  • 硬盘版win10
  • chkdsk命令有什么用
  • Slackware Linux init 进程
  • win10的帮助系统在哪
  • android面试题简书
  • python数据结构与算法分析 第2版(图灵出品)
  • unity3d c语言
  • jquery实现复选框全选
  • unity自动生成
  • 修改bash_profile
  • 台湾 游戏论坛
  • jquery给div添加样式
  • pip install clashroyale
  • 合肥新房商铺
  • 年终奖怎么报个税
  • 免责声明:网站部分图片文字素材来源于网络,如有侵权,请及时告知,我们会第一时间删除,谢谢! 邮箱:opceo@qq.com

    鄂ICP备2023003026号

    网站地图: 企业信息 工商信息 财税知识 网络常识 编程技术

    友情链接: 武汉网站建设