【操作系统笔记】任务调度&信号处理&CPU上下文

2023-09-21 00:02:24

任务调度

何时需要调度执行一个任务?

  • 第一:当任务创建的时候,需要决定是继续执行父进程,还是调度执行子进程

  • 第二:在一个任务退出时,需要做出调度决策,需要从 TASK_RUNNING 状态的所有任务中选择一个任务来执行

  • 第三:当一个任务阻塞在 I/O 上,或者因为其他原因阻塞,必须调度另一个任务执行

  • 第四:在一个 I/O 中断发生时,必须做出调度决策。

    I/O 中断来源于 I/O 设备,说明 I/O 的工作结束了,需要唤醒正在阻塞在这个 I/O 上的进程,这个时候,调度程序要决定是否调度这个被唤醒的任务。

  • 第五:时钟中断发生的时候

在这里插入图片描述

问题:如何实现对响应时间敏感的调度程序?

  • 轮转调度(Round-Robin, RR)

  • 基本思想:在一个时间片内运行一个任务,时间片结束,然后切换到下一个任务,而不是运行一个任务直到结束。这样反复执行,直到所有任务完成。

  • RR 有时被称为时间切片,时间片长度必须是时钟中断周期的倍数。如果时钟中断是每 10ms 中断一次,则时间片可以是 10ms20ms10ms 的任何倍数。

信号处理

什么是信号?

例如 kill -9 2334,内核先找到pid = 2334的进程,并杀掉这个进程以及 tgid = 2334 的线程。

  • 给进程2334发送9号信号:SIGKILL

  • 一共有 64 个信号:kill -l

  • 信号是很短的消息,可以被发送到一个进程或一组进程

  • 每个信号,本质上就是一个数字而已

在这里插入图片描述

信号处理大体流程:

在这里插入图片描述

信号发送:

  • kill(pid, sig):向 pid 所在的线程组发送一个sig号信号

  • tkill(pid, sig):向 pid 进程(或线程)发送一个sig号信号

  • tgkill(pid, sig, tgid):向 pid 进程(或线程)发送一个sig号信号(检查下这个进程的tgid是否等于参数中的 tgid

给一个线程组发送的信号,称为共享信号,给一个进程/线程发送的信号,称为私有信号。

信号已发送,但未处理的信号称为挂起信号,存储在 task_struct

在这里插入图片描述
在这里插入图片描述

信号处理:

每个信号都有默认的处理方式:

  • Terminate:终止进程(杀死)

  • Dump:终止进程(杀死),将进程运行的上下文信息保存到文件中,方便查询进程相关信息

  • Ignore:信号被忽略

  • Stop:停止进程,将进程的状态设置为TASK_STOPPED

  • Continue:如果进程的状态是TASK_STOPPED,那么把它 设置为 TASK_RUNNIND

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

CPU 上下文、进程上下文以及中断上下文

CPU 上下文

在 CPU 执行程序指令的时候,需要一系列的 CPU 寄存器来存储 CPU 计算时要用到的指令、临时数据等。

第一个是指令指针寄存器 (eip 或者 rip),这个其实就是我们平时说的 程序计数器 (PC),它是 CPU 中最重要的寄存器了

  • 32 位系统的话,寄存器的名字以 e 开头
  • 64 位系统的话,寄存器的名字以 r 开头

它里面存储的是:下一条需要执行的指令在内存中的虚拟地址。CPU 的工作就是不断从内存中取出它指向指令,然后执行这一条指令,同时将下一条指令在内存的地址存放到指令寄存器中。如此不断重复,这就是 CPU 的工作了。

第二个是通用寄存器,一般用于存储 CPU 执行指令过程中产生的中间数据,一般有下面的寄存器:

  1. eax / rax:通常用于执行加法,函数调用的返回值一般也放在这里
  2. ebx / rbx:存放中间临时数据
  3. ecx / rcx:通常用于计数器
  4. edx / rdx:用于存放整数除法产生的余数
  5. esp / rsp:函数调用栈的栈顶指针,指向栈的顶部
  6. ebp / rbp:函数调用栈的栈底指针,指向栈的底部
  7. esi / rsi:存放中间临时数据
  8. edi / rdi:存放中间临时数据

这些通用寄存器是程序执行时最常用的,也是最基础的寄存器,程序执行过程中,绝大部分时间都是在操作这些寄存器来实现指令的功能。

第三个是标志寄存器 (flags),里面有众多标记位,记录了 CPU 执行指令过程中的一系列状态,这些状态大都由 CPU 自动设置。

我们在【操作系统一:程序是如何运行的?】中的第 11 小节 中,讲的 if 语句的汇编指令中,就使用了标记寄存器中的零标志条件码 (Zero Flag) 这一位标志码,来实现程序指令的跳转功能。

在这里插入图片描述

第四个是段寄存器,段寄存器用于分段寻址,虽然 Linux 内核采用分页寻址,但是为了保持兼容,段寄存器有些地方仍然在使用,所以,我们还需要关心,段寄存器有 6 个:

  1. CS:代码段
  2. DS:数据段
  3. SS:栈段
  4. ES:扩展段
  5. FS
  6. GS

总结:

  • 指令指针寄存器、通用寄存器、标志位寄存器以及段寄存器,这四组寄存器共同构成了一个基本的指令执行环境,也可以称为 CPU 上下文

  • 每个寄存器,CPU 中只有一个,比如指令指针寄存器,在 CPU 中只有一个

  • 每个进程在执行的时候,都会有各自的 CPU 上下文信息,也就是说每个进程执行的时候,CPU 中的寄存器的值都有可能不同的

系统调用引起的 CPU 上下文切换

知道了什么是 CPU 上下文,就很容易理解 CPU 上下文切换,CPU 上下文切换就是 CPU 把前一个进程的 CPU 上下文保存起来,然后再加载新的进程的 CPU 上下文,这样,CPU 就可以根据指令指针中存放的新的指令内存地址,执行新的进程了。

其实,CPU 上下文切换就是修改 CPU 中的寄存器的值而已

保存下来的 CPU 上下文,会存储在系统内核中,但是具体被保存在哪里呢?这个需要看具体的场景,我们先来看看系统调用

操作系统将进程的运行空间分为内核空间和用户空间:

  • 内核空间具有最高的权限,可以直接访问所有的资源

  • 用户空间只能访问受限资源,不能直接访问磁盘等硬件设备,必须通过系统调用陷入到内核中,才能访问这些特权资源。

进程在用户空间运行时,也就是 CPU 执行用户程序代码,被称为进程的用户态。

而陷入内核空间的时候,那么 CPU 将执行内核程序代码,被称为进程的内核态。

从用户态陷入内核态,需要通过系统调用来完成。在系统调用的过程中会发生 两次 CPU 上下文切换

  1. 首先将进程的用户态的 CPU 上下文保存到内核栈的 pt_regs 中,然后,为了执行内核的代码指令,操作系统需要将 CPU 寄存器的值更新为内核态相关的值,然后开始执行内核态程序
  2. 当系统调用结束后,将内核栈中的 pt_regs 中的用户态的 CPU 上下文,恢复到 CPU 寄存器中,然后切换用户空间,继续运行进程

注意:系统调用过程中一直是在同一个进程中进行的。

进程 / 线程上下文切换

一个进程的上下文信息包含:

  1. CPU 上下文
  2. 用户态虚拟内存,即 mm_struct,这个里面包含了进程页表
  3. TLB 页表项缓存数据
  4. 磁盘文件信息
  5. 信号处理信息
  6. 内核栈

在一个进程里,所有的线程共享进程的资源,比如虚拟内存、磁盘文件、信号处理等,不过线程也有自己的数据,一个线程的上下文包含:

  1. CPU 上下文
  2. 线程用户栈
  3. 线程内核栈

在 Linux 中线程是 CPU 任务调度的最小单位。

一个 CPU 同一时刻只能调度执行一个线程,所以,多线程运行的时候,肯定会出现线程切换。

线程切换又分为三种情况:

  1. 切换的两个线程是在同一个进程内
  2. 切换的两个线程不在同一个进程内
  3. 切换的两个线程有一个是内核线程

接下来我们分别来看下以上三种情况。

第一种情况:切换的两个线程在同一个进程内。 这种情况下需要做下面的几件事:

  1. 切换 CPU 上下文
  2. 切换用户栈
  3. 切换内核栈

第二种情况:切换的两个线程不在同一个进程内。 这种情况下需要做下面的几件事:

  1. 切换 CPU 上下文
  2. 切换用户态虚拟内存 (这里会切换用户栈)
  3. 切换页表
  4. 刷新 TLB 页表项缓存
  5. 切换内核栈

可以看出切换两个不在同一个进程的线程,其实就是切换进程上下文了,比切换在同一个进程中的两个线程开销要大。

第三种情况:切换的两个线程中有一个是内核线程。 这种情况下需要做下面的几件事:

  1. 切换 CPU 上下文
  2. 切换内核栈

因为内核线程只运行在内核,没有用户空间的虚拟内存,所以不需要切换用户态虚拟内存、不需要切换页表,也就不需要刷新 TLB。这样的话,内核线程切换的开销也不大。

中断上下文切换

为了快速响应硬件的事件,中断处理会打断进程的正常调度和执行,转而调用中断处理程序,响应设备事件。

而在打断其他进程时,就需要将进程当前的状态保存下来,这样在中断结束后,进程仍然可以从原来的状态恢复运行。

跟进程上下文不同,中断上下文切换并不涉及到进程的用户态。

所以,即便中断过程打断了一个正处在用户态的进程,也不需要保存和恢复这个进程的虚拟内存、磁盘文件、信号处理等用户态资源。

中断上下文,其实只包括内核态中断服务程序执行所必需的状态,包括 CPU 寄存器、内核堆栈、硬件中断参数等。

对同一个 CPU 来说,中断处理比进程拥有更高的优先级,所以中断上下文切换并不会与进程上下文切换同时发生。

同样道理,由于中断会打断正常进程的调度和执行,所以大部分中断处理程序都短小精悍,以便尽可能快的执行结束。

另外,跟进程上下文切换一样,中断上下文切换也需要消耗 CPU,切换次数过多也会耗费大量的 CPU,甚至严重降低系统的整体性能。

所以,当你发现中断次数过多时,就需要注意去排查它是否会给你的系统带来严重的性能问题。

总结

  • CPU 上下文一组 CPU 寄存器,包括:指令指针寄存器、通用寄存器、标志位寄存器以及段寄存器,不同进程切换时切换 CPU 上下文就是指切换 CPU 寄存器中的值

  • 系统调用会发生 2 次 CPU 上下文切换,从用户态陷入内核态, 首先将进程的用户态的 CPU 上下文保存到内核栈中,然后操作系统需要将 CPU 寄存器的值更新为内核态相关的值,开始执行内核态程序代码指令,当系统调用结束后,将内核栈中的用户态的 CPU 上下文,恢复到 CPU 寄存器中,然后切换用户空间,继续运行进程

  • 进程 / 线程上下文切换时,也会发生 CPU 上下文切换

    1)如果是在同一个进程内的两个线程切换,则需要切换CPU上下文、用户栈内核栈

    2)如果是在不同进程的两个线程切换,则需要切换CPU上下文、用户栈内核栈,还需切换页表,刷新TLB页表项缓存,此时就是切换两个进程

    3)如果切换的两个线程中有一个是内核线程,则只需要切换CPU上下文内核栈,因为内核线程只运行在内核,没有用户空间的虚拟内存,所以不需要切换用户态虚拟内存、不需要切换页表

  • 中断上下文切换不会涉及进程的用户态,只包括内核态中断服务程序执行所必需的状态,包括 CPU 寄存器、内核堆栈、硬件中断参数等

更多推荐

IP代理安全吗?如何防止IP被限制访问?

你是否遇到过可以正常上网,但访问某个网站却被禁止?注册某个网站账号,却被封号?那都是因为IP出现问题!您的IP地址透露很多关于您的信息,包括您的位置和互联网活动。在本文中,我们将一起了解IP地址,网站如何利用它来跟踪您,以及与IP代理如何帮助您更好的推进业务。什么是IP地址?IP地址是互联网协议地址(InternetP

Mock数据:单元测试中的心灵鸡汤

在当今的软件开发领域,质量控制已经成为了一个不可或缺的环节。为了确保软件的稳定性和可靠性,开发者们投入了大量的时间和精力进行各种测试。其中,单元测试作为最基础的测试方法,其重要性不言而喻。然而,单元测试中的一个关键问题是如何获取和管理测试数据。这就是Mock数据发挥作用的地方。本文将为您深入剖析Mock数据的定义、优势

echarts制作关系图谱

<!DOCTYPEhtml><html><head><metacharset="utf-8"/><title>ECharts</title><!--引入刚刚下载的ECharts文件--><scriptsrc="https://cdnjs.cloudflare.com/ajax/libs/echarts/5.4.3/ec

SpringMVC的拦截器和JSR303的使用

目录一、JSR303二、拦截器(interceptor)一、JSR3031.1.什么是JSR303JSR303,它是JavaEE(现在称为JakartaEE)规范中的一部分。JSR303定义了一种用于验证Java对象的标准规范,也称为Bean验证。Bean验证是一种用于验证对象属性的框架,它可以确保对象符合特定的规则和

Jmeter 分布式压测

‍你可以使用JMeter来模拟高并发秒杀场景下的压力测试。这里有一个例子,它模拟了同时有5000个用户,循环10次的情况‍。请求默认配置token配置秒杀接口结果分析但是,实际企业中,这种压测方式根本不满足实际需求。下面介绍一种分布式压测。使用场景单台的JMeter压测能力有限,最大并发压测在1k内的,单机基本满足日常

从零开始搭建医药领域知识图谱实现智能问答与分析服务(含码源):含Neo4j基于垂直网站数据的医药知识图谱构建、医药知识图谱的自动问答等

项目设计集合(人工智能方向):助力新人快速实战掌握技能、自主完成项目设计升级,提升自身的硬实力(不仅限NLP、知识图谱、计算机视觉等领域):汇总有意义的项目设计集合,助力新人快速实战掌握技能,助力用户更好利用CSDN平台,自主完成项目设计升级,提升自身的硬实力。专栏订阅:项目大全提升自身的硬实力[专栏详细介绍:项目设计

学术团体的机器人相关分会和机器人相关大赛的说明

1.中国机械工程学会(机器人分会)2017年成立,地点华中科技大学:中国机械工程学会机器人分会在汉成立(huanqiu.com)链接:中国机械工程学会(cmes.org)侧重点:工业机械臂、工厂和物流相关的移动机器人、码垛和焊接相关的机器人,偏重机械方面?举办会议名称:第N届中国机器人学术年会指导或者主办机器人相关大赛

在gazebo仿真环境中加载多个机器人

文章目录前言一、基本概念1、xacro2、Gazebo加载单个机器人模型二、原先launch文件代码三、修改launch文件加载多个机器人总结前言单个机器人的各项仿真实验都基本完成,也实现了远程控制,接下来主要对多机器人编队进行仿真实验,在进行多机器人编队控制前,先要在gazebo仿真中加载多个机器人。一、基本概念在g

D*算法(C++/MATLAB)

前言路径规划一直是机器人、自动驾驶、游戏开发等领域中的关键问题。D算法和A算法都是用于解决路径规划问题的重要算法。本文将深入介绍D算法的原理、实现和应用,并对比D算法与A*算法的区别。什么是D*算法?D算法(D-Star算法)是一种增量式路径搜索算法,最早由SvenKoenig和MaximLikhachev在2002年

并发编程——ReentrantReadWriteLock

文章目录为什么要出现读写锁读写锁的核心思想写锁的操作写锁加锁-acquire写锁-释放锁操作读锁的操作读锁的加锁操作总结为什么要出现读写锁因为ReentrantLock是互斥锁,如果有一个操作是读多写少,同时还需要保证线程安全,那么使用ReentrantLock会导致效率比较低。因为多个线程在对同一个数据进行读操作时,

mysql常用数据类型(mysql数据类型)字符集

文章目录mysql常用数据类型什么时候用等长数据类型,什么时候用变长数据类型?什么时候用char,什么时候用binary?怎么区分文本数据和二进制数据?mysql字符集与数据类型的区别与联系mysql常用数据类型MySQL支持多种数据类型,以下是一些最常用的:数值类型:INT:用于存储整数。FLOAT:用于存储浮点数。

热文推荐