20252803《Linux内核原理与分析》第九周作业
阅读学习教材「庖丁解牛Linux 操作系统分析 」第9章,有问题优先使用chatgpt等AI工具。或者到蓝墨云班课中提问,24小时内回复,鼓励解答别人问题,提问前请阅读「如何提问」。教材深入学习关注豆列「Linux内核及安全」。学习蓝墨云班课中第九周视频「Linux系统架构和执行过程概览」,并完成实验楼上配套实验八。,注意从下往上看。基于树莓派或其他平台完成ARM相关内容。
作业要求
阅读学习教材「庖丁解牛Linux 操作系统分析 」第9章,有问题优先使用chatgpt等AI工具。或者到蓝墨云班课中提问,24小时内回复,鼓励解答别人问题,提问前请阅读「如何提问」。
教材深入学习关注豆列「Linux内核及安全」。
学习蓝墨云班课中第九周视频「Linux系统架构和执行过程概览」,并完成实验楼上配套实验八。,注意从下往上看。基于树莓派或其他平台完成ARM相关内容。
作业标题 “学号《Linux内核原理与分析》第X周作业”,重点是遇到的问题和解决方案内容涵盖教材学习和视频,提交格式用Markdown,同时提交转换的 PDF(VSCode 有相关插件)。
实验八:理解进程调度时机跟踪分析进程调度与进程切换的过程
根据本周所学知识分析并理解 Linux 中进程调度与进程切换过程
1、理解 Linux 系统中进程调度的时机,可以在内核代码中搜索 schedule()函数,看都是哪里调用了 schedule(),判断我们课程内容中的总结是否准确;
2、使用 gdb 跟踪分析一个 schedule()函数 ,验证您对 Linux 系统进程调度与进程切换过程的理解;推荐在实验楼 Linux 虚拟机环境下完成实验。
3、特别关注并仔细分析 switch_to 中的汇编代码,理解进程上下文的切换机制,以及与中断上下文切换的关系;
1、理解 Linux 系统中进程调度的时机
在Linux 系统中搜索schedule()函数,有如下操作:
(1)使用 grep 命令,在指定的内核源代码路径中递归搜索包含 “schedule(” 字符串的文件:
grep -r "schedule(" /path/to/kernel/source
//这里的/path/to/kernel/source是你的内核文件路径
(2)使用 find 和 grep 命令,在指定的内核源代码路径中递归搜索所有 .c 文件,并查找包含 “schedule(” 的行:
find /path/to/kernel/source -name "*.c" -exec grep -H "schedule(" {} \;
(3)使用 ctags 和 grep 命令,ctags 工具可以生成一个标签文件,然后可以使用 grep 在该文件中搜索 schedule(:
ctags -R /path/to/kernel/source
grep -n "schedule(" tags
这里使用grep进行查找展示:
grep -r "schedule()" /home/shiyanlou/LinuxKernel/linux-3.9.4/kernel

分析并结合云班课内容,得知进程调度的时机如下:
1>中断处理过程(包括时钟中断、I/O中断、系统调用和异常)中,直接调用schedule(),或者返回用户态时根据need_resched标记调用schedule()。
2>内核线程可以直接调用schedule()进行进程切换,也可以在中断处理过程中进行调度,也就是说内核线程作为一类的特殊的进程可以主动
3>用户态进程无法实现主动调度,仅能通过陷入内核态后的某个时机点进行调度,即在中断处理过程中进行调度。
进程切换如下:
为了控制进程的执行,内核必须有能力挂起正在CPU上执行的进程,并恢复以前挂起的某个进程的执行,这叫做进程切换、任务切换、上下文切换,即进程上下文切换。挂起正在CPU上执行的进程,与中断时保存现场是不同的,中断前后是在同一个进程上下文中,只是由用户态转向内核态执行。进程上下文包含了进程执行需要的所有信息。
其中,linux系统执行过程中的几个特殊情况如下:
1>通过中断处理过程中的调度时机,用户态进程与内核线程之间互相切换和内核线程之间互相切换,与最一般的情况非常类似,只是内核线程运行过程中发生中断没有进程用户态和内核态的转换;
2>用户态进程不能主动调度schedule(),但内核线程可以主动调用schedule(),只有进程上下文的切换,没有发生中断上下文的切换,与最一般的情况略简略 ;
3>创建子进程的系统调用在子进程中的执行起点及返回用户态,那么不从标号1开始执行,从用户态开始执行,next ip=ret from work,如fork ;
4>加载一个新的可执行程序后返回到用户态的情况,如execve。
2、使用 gdb 跟踪分析一个 schedule()函数
(1)基础搭建部分
先完成以下代码,实现test.c文件的更换,即换成test_exec.c
cd LinuxeKernel
rm -rf menu
git clone https://github.com/mengning/menu.git
cd menu
mv test_exec.c test.c
make rootfs

打开一个冻结内核,再打开一个shell进行gdb分析调试
cd LinuxKernel
qemu -kernel linux-3.18.6/arch/x86/boot/bzImage -initrd rootfs.img -s -S //冻结内核的启动

新打开一个空shell,进入gdb调试,并建立连接:
cd LinuxKernel
gdb
(gdb)file linux-3.18.6/vmlinux
(gdb)target remote:1234

基础部分搭建完成,然后开始gdb分析schedule()函数
2、gdb调试部分
分别在schedule(进程调度的主体函数)context_switch(实现进程切换的函数)pick_next_task(负责根据调度策略和调度算法选择下一个进程)三处设置断点,而switch_to为宏定义,不能设置断点,需到context_switch函数中单步执行查看调用。
即
b schedule
b context_switch
b pick_next_task

下面进行分析:
由于switch_to不能设置断点,需要进行汇编级代码的分析。
3、分析 switch_to 中的汇编代码,理解进程上下文的切换机制和中断上下文切换的关系
汇编代码及分析如下:
asm volatile(
"pushfl\n\t" //保存当前进程flags
"pushl %%ebp\n\t" //当前进程堆栈基址压栈
"movl %%esp,%[prev_sp]\n\t" //保存ESP,将当前堆栈栈顶保存起来
"movl %[next_sp],%%esp\n\t" //更新ESP,将下一栈顶保存到ESP中
// 完成内核堆栈的切换
"movl $1f,%[prev_ip]\n\t" //保存当前进程的EIP
"pushl %[next_ip]\n\t" //将next进程起点压入堆栈,即next进程的栈顶为起点
__switch_canary //next_ip一般为$1f,对于新创建的子进程是ret_from_fork
"jmp __switch_to\n" //prve进程中,设置next进程堆栈,jmp与call不同,是通过寄存器传递参数(call通过堆栈),所以ret时弹出的是之前压入栈顶的next进程起点
//完成EIP的切换
"1:\t" //next进程开始执行
"popl %%ebp\n\t" //restore EBP
"popfl\n" //restore flags
//输出量
: [prev_sp] "=m" (prev->thread.sp), //保存当前进程的esp
[prev_ip] "=m" (prev->thread.ip), //保存当前进仓的eip
"=a" (last),
//要破坏的寄存器
"=b" (ebx), "=c" (ecx), "=d" (edx),
"=S" (esi), "=D" (edi)
__switch_canary_oparam
//输入量
: [next_sp] "m" (next->thread.sp), //next进程的内核堆栈栈顶地址,即esp
[next_ip] "m" (next->thread.ip), //next进程的eip
// regparm parameters for __switch_to():
[prev] "a" (prev),
[next] "d" (next)
__switch_canary_iparam
: //重新加载段寄存器
"memory");
整个过程中,涉及了堆栈的切换、指令指针的切换,以及寄存器的保存和加载。
进程上下文切换的核心机制,包含堆栈切换、指令指针切换,以及寄存器的保存与加载 , 这些操作共同保障了进程间切换时的执行连续性与正确性。
它与中断上下文切换的关联之处在于,二者均需通过保存和加载寄存器的操作,实现上下文的无缝衔接,确保切换前后的执行状态不被破坏。
4、使用AI答疑

更多推荐



所有评论(0)