【操作系统笔记】内存布局&内存映射

2023-09-20 16:08:30

虚拟内存布局

在这里插入图片描述

虚拟地址空间大小:

  • 32位虚拟地址空间 [0 ~ 2^32 - 1] 总共4GB
  • 64位虚拟地址空间 [0 ~ 2^64 - 1] 总共16 777 216TB

在这里插入图片描述

不管是运行在用户态还是内核态,都需要使用虚拟地址,这是因为计算机硬件要求的,CPU要经过地址转换得到最终的物理地址,软件必须服从硬件的规定。

在这里插入图片描述
在这里插入图片描述

内核态的虚拟空间和某一个程序没有关系,所有程序通过系统调用进入到内核之后,看到的虚拟地址空间都是一样的。

在这里插入图片描述

在这里插入图片描述

  • 32 位虚拟地址空间中,[0x0000 0000, 0xBFFF FFFF] 的 3GB 空间用作用户态,是每一个应用程序可以使用的虚拟地址范围,[0xC000 0000, 0xFFFF FFFF] 的 1GB 空间用作内核态,是给操作系统内核使用的虚拟地址范围

  • 每个用户程序都使用相同的虚拟地址空间 [0x0000 0000, 0xBFFF FFFF],每个内核程序也使用相同的虚拟地址空间 [0xC000 0000, 0xFFFF FFFF]

  • 64 位虚拟地址空间中,低 128T 虚拟地址空间被用作用户态,高 128T 虚拟地址空间被用作内核态,中间留有空洞

在这里插入图片描述

在这里插入图片描述
在这里插入图片描述

用户态虚拟内存布局,从上往下分别是:

  • 栈(stack)

  • mmap内存映射区

  • 运行时堆区(heap)

  • 数据段(.bss和.data)

  • 代码段(.text)

其中栈空间是倒着向下增长的,堆区空间是向上增长的,栈和堆是相对增长,消耗中间的地址空间。mmap区和堆区也可以相对增长(64位中mmap区往哪边增长都可以)

内存映射

Linux 中通过将一块虚拟地址内存空间和一个文件对象关联起来,以初始化这块虚拟内存的内容,这个过程称为内存映射(memory mapping)。

这里的文件对象可以是:

  • ① Linux文件系统中的普通文件
  • ② 也可以是一个匿名文件,即一块全部包含二进制零的物理内存。

在这里插入图片描述

普通文件的内存映射:

  • 首先将用户程序的虚拟地址和磁盘文件进行映射,

  • 当访问虚拟页的时候,由缺页异常处理程序将磁盘文件内容加载到物理内存中,同时更新用户程序的虚拟页表中虚拟页号对应的物理页号,这样程序通过虚拟地址访问物理内存就相当于访问该文件内容,对物理内存操作就相当于操作该文件。

在这里插入图片描述

匿名文件的内存映射:

  • 直接将一块包含二进制零的物理内存和用户的虚拟地址进行映射,缺页异常处理程序将对应的物理页号更新到虚拟页表中即可。

需要注意,内存映射也是要经过页表将虚拟内存地址映射到物理内存地址的,并不是说可以直接在代码中访问到关联的物理内存地址。记住,用户程序中能访问到的永远是虚拟地址空间,即便是通过mmap内存映射也是如此。

共享内存映射

在这里插入图片描述

共享内存映射:

  • 当一个文件和程序 1 的虚拟地址建立内存映射之后,程序 2 需要访问该文件内容时,可以直接与对应的物理内存页建立映射,实现不同的程序的虚拟内存共享同一块物理内存,即共享同一个文件对象。

  • 共享内存映射的最佳应用就是著名的动态链接共享库(.so库文件),它可以节约物理内存避免重复浪费(相对于静态链接库而言)。通过共享内存映射,不同的应用程序只需要共享物理内存中的同一份共享库代码,不需要每个应用程序都保留一份,因此提高了内存利用率

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

然而,只要有一个程序试图写私有区域内的某个页面,那么这个写操作就会触发一个保护故障。故障处理程序注意到保护异常是由于程序试图写私有的写时赋值区域中的一个页面而引起的,它就会在物理内存中创建这个页面的一个新副本,更新页表项指向这个新的副本,然后恢复这个页面的可写权限。这就是写时复制技术。

内存映射函数 mmap

内存映射的详细流程图:https://www.processon.com/view/link/627f9bfdf346fb3cb3fb696f

#include <unistd.h>
#include <sys/mmam.h>
// 返回:若成功时则返回指向映射区域的指针,若出错则返回 MAP_FAILED(-1)
void *mmap(void *start, size_t length, int prot, int flags, int fd, off_t offset) 

在这里插入图片描述

参数 prot 包含描述新映射的虚拟内存区域的访问权限位:

  • PROT_EXEC:这个区域内的页面由可以被 CPU 执行的指令组成
  • PROT_READ:这个区域内的页面可读
  • PROT_WRITE:这个区域内的页面可写
  • PROT_NONE:这个区域内的页面不能被访问

参数 flags 由描述被映射对象类型的位组成:

  • MAP_ANON :如果设置了 MAP_ANON 标记位,那么这个被映射的对象就是一个匿名对象,而相应的虚拟页面是请求二进制零的
  • MAP_PRIVATE:表示被映射的对象是一个私有的、写时复制的对象
  • MAP_SHARED:表示是一个共享对象。
bufp = mmap(NULL, size, PROT_READ, MAP_PRIVATE | MAP_ANON, 0, 0) 

上面代码表示让内核新建一个新的包含size字节的只读、私有、请求二进制零虚拟内存区域。如果调用成功,那么bufp则是新区域的起始地址

#include <unistd.h>
#include <sys/mmam.h>
// 若成功则返回 0,若出错则返回 -1
int munmap(void *start, size_t length);

munmap 函数删除从虚拟地址 start 开始的,由接下来 length 字节组成的区域。接下来对已删除区域的引用会导致段错误。

在这里插入图片描述

  • Linux 提供了mmapmunmap函数来进行虚拟地址和文件对象的映射和删除映射操作
  • 操作系统加载应用的 ELF 文件时,用户程序的每一段虚拟地址都是通过mmap采用内存映射加载到内存的,就是把虚拟地址空间和 ELF 中某一部分关联映射,用户程序的某些段可能是私有的映射(如栈和运行时堆),某些可能是共享的映射(如so共享库映射区)

内存映射区的管理

用户程序的虚拟内存的每一段映射区,被抽象成一个结构体vm_area_struct,为提高查询效率,不同映射区之间的vm_area_struct使用链表+红黑树来维护。

在这里插入图片描述
在这里插入图片描述

问题:给你一个虚拟地址,如何快速找到这个虚拟地址位于哪一个 vm_area_struct ?

  • 顺序遍历链表,对于每个节点确定虚拟地址是否在节点映射虚拟地址范围内,时间复杂度 O(n)

  • mmap 是一个常见的操作,所以链表可能会挺长的

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

mmap流程:

在这里插入图片描述

内存布局总结图

32 位系统虚拟内存布局总结图链接:https://www.processon.com/view/link/6232f11d5653bb074b22d983

在这里插入图片描述

64 位系统虚拟内存布局总结图链接:https://www.processon.com/view/link/623311f8e401fd0726c20d50

在这里插入图片描述

64位直接映射区范围大小是64T,足够覆盖所有的物理内存范围,所以不需要也不存在高端内存映射区。

用户程序页表和内核页表

每个应用程序的虚拟地址空间分为两部分:

  • ① 用户态虚拟地址空间
  • ② 内核态虚拟地址空间
    在这里插入图片描述

所以一个应用程序的页表也有两部分:

  • ① 第一部分用于映射用户态虚拟页到物理页
  • ② 第二部分用于映射内核态虚拟页到物理页

其中:

  • 用户态虚拟页到物理页的映射,在 CPU 访问用户态虚拟内存发生缺页异常时,由缺页异常处理程序维护映射关系
  • 内核态虚拟页到物理页的映射,是在程序加载启动的时候,从内核页表拷贝过来的

注意:内核页表是所有应用程序共享的,而用户态页表是每个应用程序私有的,每个程序都不一样。

程序页表的每一个页表项中有一个标记位,来标记这个页表项是属于用户态还是内核态:

  • 当程序运行在用户态的时候,只能访问标记为用户态的页表项,
  • 当程序通过系统调用,陷入到内核态后,可以访问程序页表中的所有页表项
  • 内核程序是有特权的
  • 页表项:有效位、权限、物理页号
  • 标记位的作用:隔离内核态和用户态的页表

在这里插入图片描述

问题:为什么维护了内核页表,还要将内核页表拷贝到程序页表?

  • 主要为了提高性能,当一个应用程序通过系统调用陷入内核态时,就不需要切换页表了,直接使用程序页表就可以,因为程序页表中包含了内核页表部分。切换页表需要消耗性能,比如需要刷新 TLB 页表项缓存。

  • 空间换时间的设计

缺页异常处理程序

用户态缺页异常处理程序的执行逻辑流程图:https://www.processon.com/view/link/6235ab0ce0b34d75aad6ba71

问题:用户态程序访问页表会陷入内核态吗?

  • 首先,页表都是保存在内核态的,这个主要是为了安全,因为这样的话用户态程序就不能随意修改页表了,也就是只有内核可以修改页表。当发生缺页异常,执行内核中的缺页异常处理程序时,修改页表。

  • 程序处于用户态时,访问页表也不需要陷入内核态,因为访问页表是 MMU+TLB+CR3 这些硬件完成的不关程序啥事情,所以,这时程序也不需要陷入内核态。

更多推荐

经典算法-----约瑟夫问题(C语言)

目录前言故事背景约瑟夫问题环形链表解决数组解决前言今天我们来玩一个有意思的题目,也就是约瑟夫问题,这个问题出自于欧洲中世纪的一个故事,下面我们就去通过编程的方式来解决这个有趣的问题,一起来看看吧!故事背景据说著名犹太历史学家Josephus有过以下的故事:在罗马人占领乔塔帕特后,39个犹太人与Josephus及他的朋友

《cpolar内网穿透》外网SSH远程连接linux(CentOS)服务器

本次教程我们来实现如何在外公网环境下,SSH远程连接家里/公司的LinuxCentOS服务器,无需公网IP,也不需要设置路由器。视频教程[video(video-jrpesBrv-1680147672481)(type-csdn)(url-CSDN直播https://live-file.csdnimg.cn/relea

【Java和C++】什么是多态

2023年9月20日,周三上午今天写作业的时候遇到了多态,但我感觉自己多多态还是不够理解,于是又深入研究了一下。不过,我觉得我写的这篇文章还不够完整,比如说没提到什么时候适合使用多态,以后有空再写上吧。目录什么是多态Java方法重写(MethodOverriding)接口(Interface)抽象类(AbstractC

三、支持向量机算法(SVC,Support Vector Classification)(有监督学习)

支持向量机SupportVectorMachine,就是所谓的SVM,它指的是一系列的机器学习算法,根据解决问题的不同,分为SVC(分类)和SVR(回归)SVC,SupportVectorClassification,其本质也是支持向量机supportvector,只不过是用于分类classification任务SVR

【实战】Streamlit+ECharts绘制多图表可视化大屏,超级实用

实战项目背景介绍当我们提到数据可视化,常常会想到众多的工具和库,如Matplotlib、Seaborn甚至于D3.js等。但是,有一个特定的组合正在快速走红:Streamlit和ECharts。Streamlit,作为一个轻量级的Python工具,允许数据科学家和工程师轻而易举地创建交互式的web应用。而ECharts

网络安全(黑客)自学

前言首先我谈下对黑客&网络安全的认知,其实最重要的是兴趣热爱,不同于网络安全工程师,他们大都是培训机构培训出来的,具备的基本都是防御和白帽子技能,他们绝大多数的人看的是工资,他们是为了就业而学习,为了走捷径才去参加培训。而我进大厂主要是靠自学内推进来是,当时我才20岁,基于对脚本小子的热爱,我每次工作做完了,就天天抱着

vue如何实现多页面应用网页

Vue通常用于构建单页面应用(SPA),但是如果你需要构建多页面应用的话,也可以使用Vue。以下是实现多页面应用的一些建议:创建多个Vue实例为每个页面创建一个Vue实例,这样每个页面都可以拥有自己独立的Vue实例,它们之间不会相互影响。在每个页面上,你可以使用Vue组件来组织和管理该页面的所有逻辑。使用路由管理多页面

【吴恩达】prompt engineering(原则 迭代 文本概括 推断、订餐机器人)

简介Introduction基础的LLM训练的模型,问法国的首都什么,可能会将答案预测为“法国最大的城市是什么,法国的人口是多少”许多LLMs的研究和实践的动力正在指令调整的LLMs上。指令调整的LLMs已经被训练来遵循指令。因此,如果你问它,“法国的首都是什么?”,它更有可能输出“法国的首都是巴黎”。指令调整的LLM

设计模式-命令模式

“小度,小度,热死了请打开空调~”,“小度,小度,主人回家了~”,“小度,小度,播放一首炸雷~”,像小度类似的智能产品正在逐步改善我们的生活,只要我们一声令下,产品立马执行,毫不拖延。就如同老板的命令一样,系统需接收到命令后经过一系列分析后,会自动选择执行哪些命令,而发令者完全不关心内部是执行了哪些动作以及哪个具体方法

【校招VIP】排序算法之高级排序

考点介绍:在校招面试中,排序算法是经常被问到的。排序算法又比较多,很容易遗忘和混淆。有相当同学校招卡在排序的实现上,要么是核心代码实现不了,要么是实现方法串台。大厂的考察重点在快速排序等高级排序上。排序算法之高级排序-相关题目及解析内容可点击文章末尾链接查看!一、考点试题1.以下哪种不是非稳定排序算法A.归并排序B.快

分库分表知识点

分库分表专题1.概述1.1分库分表是什么小明是一家初创电商平台的开发人员,他负责卖家模块的功能开发,其中涉及了店铺、商品的相关业务,设计如下数据库:通过以下SQL能够获取到商品相关的店铺信息、地理区域信息SELECTp.*,r.[地理区域名称],s.[店铺名称],s.[信誉]FROM[商品信息]pLEFTJOIN[地理

热文推荐