进程管理：fork 与 exec

fork 和 exec 是 UNIX 最独特的设计之一。创建新进程为什么要分成两步？fork 复制当前进程，exec 替换进程的内存映像，这种分离给了程序员极大的灵活性：可以在 fork 之后、exec 之前做任何初始化工作（重定向、环境变量、关闭文件）。本章将实现简化版的 fork 和 exec，以及进程退出机制。

重要说明：本章实现的是简化版的进程管理，用于演示核心概念。与完整的 UNIX 进程模型相比，缺少许多高级特性，如 Copy-on-Write、ELF 加载、文件描述符管理等。

进程管理概述#

进程是操作系统中最核心的抽象之一。进程管理主要解决以下问题：

程序执行：如何加载和执行用户程序？
进程创建：如何从一个进程创建新的进程？
进程隔离：如何保证不同进程的地址空间相互独立？
进程关系：如何管理父子进程之间的关联？
资源管理：如何管理进程使用的内存、文件等资源？

在实现完整的进程模型之前，需要先理解其核心概念。本章的简化实现将帮助我们理解：

进程的基本结构
fork 系统调用的工作原理
exec 系统调用的工作原理
进程退出和清理机制

进程管理的核心机制#

进程结构（process_t）#

进程结构是操作系统管理进程的核心数据结构。它存储了进程的所有关键信息，包括进程 ID、状态、内存管理信息、父子关系等。没有进程结构，操作系统就无法跟踪和管理进程的生命周期。

本章实现的进程结构是一个简化版本，与完整 UNIX 进程模型相比有以下区别：

实际实现的进程结构：

1
typedef struct process {
2
    pid_t pid;                      /* 进程ID */
3
    char name[32];                  /* 进程名 */
4
    process_state_t state;          /* 进程状态 */
5

6
    /* 内存管理 */
7
    uint32_t *page_dir;             /* 页目录 */
8
    uint32_t user_stack_top;        /* 用户栈顶 */
9
    uint32_t kernel_stack_top;      /* 内核栈顶 */
10

11
    /* 线程管理 */
12
    task_t *main_thread;            /* 主线程 */
13
    struct list_node thread_list;   /* 线程链表 */
14
    int thread_count;               /* 线程数量 */
15

16
    /* 父子进程关系 */
17
    struct process *parent;         /* 父进程 */
18
    struct list_node children;      /* 子进程链表 */
19
    struct list_node sibling;       /* 兄弟进程链表 */
20

21
    /* 退出状态 */
22
    int exit_code;                  /* 退出码 */
23
    int refcount;                   /* 引用计数 */
24
} process_t;

与完整 UNIX 进程的区别：

特性	本章实现	完整 UNIX 进程
父进程 ID (ppid)	否（用 parent 指针）	是
文件描述符表 (files[])	否	是 (MAX_FDS)
等待队列 (wait_queue)	否	是
堆管理 (heap_start/heap_end)	否	是
进程组 (pgid)	否	是
会话 (sid)	否	是
信号处理	否	是

进程状态转换#

stateDiagram-v2 [*] --> 创建: process_create() 创建 --> 就绪: 分配完成就绪 --> 运行: schedule() 运行 --> 就绪: 时间片到期运行 --> 阻塞: 等待 I/O/信号量阻塞 --> 就绪: 被唤醒运行 --> 僵尸: exit() 僵尸 --> [*]: 资源回收 note right of 运行进程正在CPU上执行 end note note right of 阻塞等待键盘输入、信号量等资源 end note note right of 僵尸进程已退出但未被父进程回收注意：wait未实现，无法自动回收 end note

简化版 fork 系统调用#

fork 系统调用是 UNIX 进程模型的核心，它允许一个进程创建一个完全独立的副本。这为进程间通信、并行执行提供了基础。

完整的 fork 系统调用需要：

复制父进程的页目录和页表（创建独立地址空间）
使用 Copy-on-Write 技术优化性能
复制文件描述符表
设置父子进程关系

本章实现的 fork 是简化版本，只创建了新的内核线程，父子进程共享地址空间：

graph TD A[父进程] -->|fork| B[创建子进程] B --> C[分配 process_t 结构] C --> D[创建新线程] D --> E[共享页目录] E --> F[设置父子关系] F --> G[返回子进程 PID] style A fill:#e1f5fe style B fill:#fff3e0 style C fill:#f3e5f5 style D fill:#e8f5e9 style E fill:#ffebee style F fill:#fff9c4 style G fill:#e1bee7

内存布局对比：

graph LR subgraph full["完整 fork"] A[父进程页目录] -.->|复制| B[子进程页目录] A -->|Copy-on-Write| C[共享物理页] B --> C end subgraph simple["本章简化 fork"] D[父进程页目录] --> E[共享页表] F[子进程页目录] --> E end style A fill:#90caf9 style B fill:#90caf9 style D fill:#ffab91 style F fill:#ffab91 style E fill:#ffe0b2 style C fill:#c5e1a5

与完整 fork 的区别：

不复制地址空间：父子进程共享页表
无 Copy-on-Write：所有内存完全共享
无文件描述符复制：未实现文件描述符
创建独立的 process_t 结构
设置父子进程关系
返回子进程 PID（父进程）或 0（子进程）

简化版 exec 系统调用#

exec 系统调用允许进程加载和执行新的程序，这是实现 Shell、程序启动等功能的必要条件。没有 exec，我们就无法运行不同的用户程序。

完整的 exec 系统调用需要：

解析 ELF 可执行文件格式
加载代码段、数据段等多个段
处理动态链接库
传递命令行参数 (argv) 和环境变量 (envp)
重置文件描述符（某些场景）

本章实现的 exec 加载flat binary（裸二进制文件），流程如下：

sequenceDiagram participant User as 用户程序 participant Kernel as 内核 participant FS as 文件系统 participant MMU as 内存管理 User->>Kernel: sys_exec("program.bin") Kernel->>FS: fs_open("program.bin", READ) FS-->>Kernel: fd Kernel->>FS: fs_read(fd, buf, size) FS-->>Kernel: 读取的数据 loop 按页映射加载地址 Kernel->>MMU: vmm_map_page_default(a) MMU-->>Kernel: 映射完成 end Kernel->>MMU: memcpy(0x08048000, buf, size) loop 按页映射用户栈 Kernel->>MMU: vmm_map_page_default(a) end Kernel->>Kernel: switch_to_usermode() Kernel-->>User: 跳转到用户态执行

内存布局变化：

graph TB subgraph before["exec 之前"] A1[旧代码段] A2[旧数据段] A3[旧堆/栈] end subgraph after["exec 之后"] B1["Flat Binary<br>@ 0x08048000"] B2["新用户栈<br>@ 0x00C00000"] end A1 -.->|被覆盖| B1 A2 -.->|被覆盖| B1 A3 -.->|被替换| B2 style B1 fill:#c8e6c9 style B2 fill:#ffe082

与完整 exec 的区别：

不支持 ELF 格式：只支持 flat binary
无参数传递：不支持 argv/envp
无动态链接：只加载裸代码
不释放旧地址空间：覆盖式加载
从 SimpleFS 读取程序
加载到固定用户地址
设置用户栈
切换到用户态执行

进程退出机制#

当进程完成执行或遇到错误时，需要正确退出并释放资源。退出机制需要：

更新进程状态为僵尸态
保存退出码供父进程查询
释放进程资源
通知父进程（如果实现了 wait）

flowchart TD A[进程调用 exit] --> B{是否为用户进程?} B -->|是| C[设置退出码] B -->|否| F[内核线程退出] C --> D[状态设为 PROC_ZOMBIE] D --> E[调用 task_exit] F --> G[直接退出] E --> H[通知调度器] G --> H H --> I[进程变为僵尸态]

Note

wait 系统调用未实现，父进程无法等待子进程结束。这意味着僵尸进程不会被自动回收。

未实现的功能：

关闭文件描述符（未实现）
将子进程过继给 init（未实现）
唤醒等待的父进程（wait 未实现）

代码实现#

文件结构#

15.kernel-proc

boot

mbr.SMBR 引导程序

loader.S引导加载器

kernel

include

process.h进程管理头文件

task.h任务管理头文件

syscall.h系统调用头文件

task

process.c进程管理实现

fork.cfork 系统调用

exec.cexec 系统调用

task.c任务管理

scheduler.c调度器

runqueue.c运行队列

interrupt

syscall.c系统调用处理

timer.c定时器

mem

vmm.c虚拟内存管理

pmm.c物理内存管理

gdt.c全局描述符表

arch/x86

context_switch.S上下文切换

usermode.S用户模式切换

Makefile

README.md

进程结构（process_t）#

1
/* 进程状态 */
2
typedef enum {
3
    PROC_RUNNING,     /* 正在运行 */
4
    PROC_READY,       /* 就绪 */
5
    PROC_BLOCKED,     /* 阻塞 */
6
    PROC_ZOMBIE,      /* 僵尸态 */
7
    PROC_EXITED       /* 已退出 */
8
} process_state_t;
9

10
/* 用户空间布局常量（来自 process.h） */
11
#define USER_STACK_TOP    0xBFFFF000   /* 用户栈顶部 (3GB - 4KB) */
12
#define USER_STACK_SIZE   (64 * 1024)  /* 用户栈大小 64KB */
13
#define USER_CODE_BASE    0x08048000   /* 用户代码段起始地址 */
14
#define USER_HEAP_START   0x08049000   /* 用户堆起始地址 */
15
#define USER_HEAP_END     0xA0000000   /* 用户堆结束地址 */
16

17
/* 进程结构 */
18
typedef struct process {
19
    pid_t pid;                      /* 进程ID */
20
    char name[32];                  /* 进程名 */
21
    process_state_t state;          /* 进程状态 */
22

23
    /* 内存管理 */
24
    uint32_t *page_dir;             /* 页目录 */
25
    uint32_t user_stack_top;        /* 用户栈顶 */
26
    uint32_t kernel_stack_top;      /* 内核栈顶 */
27

28
    /* 线程管理 */
29
    task_t *main_thread;            /* 主线程 */
30
    struct list_node thread_list;   /* 线程链表 */
31
    int thread_count;               /* 线程数量 */
32

33
    /* 父子进程关系 */
34
    struct process *parent;         /* 父进程 */
35
    struct list_node children;      /* 子进程链表 */
36
    struct list_node sibling;       /* 兄弟进程链表 */
37

38
    /* 退出状态 */
39
    int exit_code;                  /* 退出码 */
40
    int refcount;                   /* 引用计数 */
41
} process_t;

fork 系统调用流程#

Note

15 章的 sys_fork_impl 是内核内部函数，并未挂到系统调用表上。syscall.c 的 syscall_init() 只注册到 SYS_GETTID（8 个），sys_fork/sys_exec 要等到 16 章完善系统调用框架时才作为系统调用注册。这里先按内核内部调用流程描述。

flowchart TD A[内核内部调用 sys_fork_impl] --> B[获取父进程] B --> C[创建子进程结构] C --> D[分配 process_t] D --> E[创建新页目录] E --> F[分配用户栈] F --> G[分配内核栈] G --> H[创建主线程] H --> I[设置父子关系] I --> J[添加到进程链表] J --> K[返回子进程 PID]

exec 系统调用流程#

flowchart TD A[用户调用 exec] --> B[sys_exec_impl] B --> C[从文件系统读取程序] C --> D{读取成功?} D -->|否| E[返回错误] D -->|是| F[映射用户空间页面] F --> G[复制程序到内存] G --> H[设置用户栈] H --> I[切换到用户态] I --> J[执行用户程序]

fork 子进程入口#

1
static void fork_child_entry(void)
2
{
3
    process_t *proc = current_process();
4
    vga_printf("[Fork-Child] pid=%u running\n", proc ? proc->pid : 0);
5
    process_exit(0);
6
}

解析：这是 fork 创建的子进程的入口函数。它打印子进程 PID 后立即退出。在完整实现中，子进程应该继续执行 fork 后的代码，但由于简化实现共享地址空间，这里只是演示概念。

fork 系统调用实现#

1
int sys_fork_impl(void)
2
{
3
    process_t *parent = current_process();
4
    task_t *parent_task = current_task();
5

6
    if (!parent_task) return -1;
7

8
    /* 创建子进程（新的 process_t 结构） */
9
    process_t *child = process_create("forked", fork_child_entry,
10
                                      parent_task->priority);
11
    if (!child) return -1;
12

13
    /* 设置父进程关系 */
14
    child->parent = parent;
15

16
    vga_printf("[Fork] Created child pid=%u from parent pid=%u\n",
17
               child->pid, parent ? parent->pid : 0);
18

19
    /* 返回子进程 PID 给父进程 */
20
    return (int)child->pid;
21
}

解析：

获取当前父进程和任务
创建新的子进程结构，指定入口函数为 fork_child_entry
建立父子进程关系
返回子进程 PID 给父进程

Note

由于共享地址空间，子进程不会返回 0，而是直接执行入口函数。

exec 系统调用实现#

1
int sys_exec_impl(const char *path)
2
{
3
    if (!path) return -1;
4

5
    /* 打开程序文件 */
6
    int fd = fs_open(path, FS_OPEN_READ);
7
    if (fd < 0) {
8
        vga_printf("[Exec] File not found: %s\n", path);
9
        return -1;
10
    }
11

12
    /* 读取程序到临时缓冲区 */
13
    char buf[4096];
14
    memset(buf, 0, sizeof(buf));
15
    ssize_t size = fs_read(fd, buf, sizeof(buf));
16
    fs_close(fd);
17

18
    if (size <= 0) {
19
        vga_printf("[Exec] Failed to read program\n");
20
        return -1;
21
    }
22

23
    vga_printf("[Exec] Loaded %d bytes from %s\n", (int)size, path);
24

25
    /* 映射加载地址的页面 */
26
    uint32_t load_addr = EXEC_LOAD_ADDR;  // 0x08048000
27
    for (uint32_t a = load_addr; a < load_addr + (uint32_t)size; a += 4096) {
28
        vmm_map_page_default(a);
29
    }
30

31
    /* 复制程序到加载地址 */
32
    memcpy((void *)load_addr, buf, size);
33

34
    /* 映射用户栈 */
35
    uint32_t stack_bottom = EXEC_STACK_TOP - EXEC_STACK_SIZE;
36
    for (uint32_t a = stack_bottom; a < EXEC_STACK_TOP; a += 4096) {
37
        vmm_map_page_default(a);
38
    }
39

40
    /* 跳转到用户空间执行 */
41
    switch_to_usermode(load_addr, EXEC_STACK_TOP);
42

43
    /* 不应到达 */
44
    return -1;
45
}

解析：

从 SimpleFS 读取 flat binary 文件
将程序加载到固定地址 0x08048000
设置用户栈空间
通过 switch_to_usermode 切换到用户态执行

关键常量（定义在 exec.c）：

EXEC_LOAD_ADDR = 0x08048000：程序加载地址
EXEC_STACK_TOP = 0x00C00000：用户栈顶
EXEC_STACK_SIZE = 16KB：用户栈大小

进程退出实现#

1
void process_exit(int exit_code)
2
{
3
    process_t *proc = current_process();
4

5
    if (proc == NULL) {
6
        /* 内核线程退出 */
7
        task_exit(exit_code);
8
        return;
9
    }
10

11
    /* 设置退出状态 */
12
    proc->exit_code = exit_code;
13
    proc->state = PROC_ZOMBIE;
14

15
    vga_printf("[Process] Process %u exiting with code %d\n",
16
               proc->pid, exit_code);
17

18
    /* 退出主线程 */
19
    task_exit(exit_code);
20
}

解析：

检查当前是否为用户进程
设置进程的退出码和状态为僵尸态
调用 task_exit 退出主线程

Note

由于 wait 未实现，僵尸进程不会被自动回收。

进程创建实现#

1
process_t *process_create(const char *name, void (*entry)(void), int priority)
2
{
3
    process_t *proc;
4
    task_t *thread;
5

6
    /* 分配进程结构 */
7
    proc = (process_t *)kmalloc(sizeof(process_t));
8
    if (proc == NULL) {
9
        vga_printf("[Process] Failed to allocate process structure\n");
10
        return NULL;
11
    }
12
    memset(proc, 0, sizeof(process_t));
13

14
    /* 分配进程ID */
15
    proc->pid = next_pid++;
16

17
    /* 设置进程名 */
18
    if (name != NULL) {
19
        strncpy(proc->name, name, sizeof(proc->name) - 1);
20
        proc->name[sizeof(proc->name) - 1] = '\0';
21
    } else {
22
        sprintf(proc->name, "process-%u", proc->pid);
23
    }
24

25
    proc->state = PROC_READY;
26
    proc->refcount = 1;
27

28
    /* 创建页目录 */
29
    proc->page_dir = create_user_page_dir();
30
    if (proc->page_dir == NULL) {
31
        vga_printf("[Process] Failed to create page directory\n");
32
        kfree(proc);
33
        return NULL;
34
    }
35

36
    /* 分配用户栈 */
37
    proc->user_stack_top = alloc_user_stack();
38

39
    /* 分配内核栈 */
40
    uint32_t kernel_stack = (uint32_t)kmalloc_aligned(KERNEL_STACK_SIZE);
41
    if (kernel_stack == 0) {
42
        vga_printf("[Process] Failed to allocate kernel stack\n");
43
        kfree(proc);
44
        return NULL;
45
    }
46
    proc->kernel_stack_top = kernel_stack + KERNEL_STACK_SIZE;
47

48
    /* 设置 TSS 内核栈 */
49
    tss_set_kernel_stack(proc->kernel_stack_top);
50

51
    /* 创建主线程 */
52
    thread = task_create_user_stub(proc->pid, proc->name, entry,
53
                                    (void *)proc->user_stack_top, priority);
54
    if (thread == NULL) {
55
        vga_printf("[Process] Failed to create main thread\n");
56
        kfree(proc);
57
        return NULL;
58
    }
59

60
    proc->main_thread = thread;
61
    proc->thread_count = 1;
62
    thread->owner = proc;
63

64
    /* 添加到进程链表 */
65
    process_list.count++;
66

67
    vga_printf("[Process] Created process '%s' (pid=%u)\n",
68
               proc->name, proc->pid);
69

70
    return proc;
71
}

解析：

分配并初始化进程结构
分配进程 ID 和设置进程名
创建页目录（复制内核映射）
分配用户栈和内核栈
创建主线程并关联进程
添加到进程链表

运行与验证#

编译运行#

1
cd 15.kernel-proc
2
make clean && make all && make run

预期输出#

main() 完成各子系统初始化后，创建 manager 内核任务并启动调度器。manager_task 负责整个演示流程：先写初始文件，再 fork 出 writer 进程写 /procN.txt，等写完后 fork 出 reader 进程读回，最后列出根目录。

1
=== Chapter 15: Process Management ===
2

3
[VMM] Initialized with fixed page tables.
4
    Page Dir @ 0x... (Virt: 0x...)
5
    Page Tables @ 0x...
6
    Page Fault handler registered for on-demand paging.
7
[Scheduler] Initialized (idle tid=1)
8
[Process] Subsystem initialized
9
[Syscall] Initialized with 8 system calls
10
Starting scheduler...
11
[Manager] Starting process management demo
12

13
[Manager] Creating initial files...
14

15
[Manager] Creating writer processes...
16
[Manager] Created writer 1 (tid=2)
17
[Manager] Created writer 2 (tid=3)
18
[Manager] Created writer 3 (tid=4)
19
[Process 2] Creating file: /proc1.txt
20
[Process 3] Creating file: /proc2.txt
21
[Process 4] Creating file: /proc3.txt
22

23
[Manager] All writers done
24

25
[Manager] Creating reader processes...
26
[Process 5] Reading file: /welcome.txt
27
[Process 6] Reading file: /proc1.txt
28
[Process 7] Reading file: /proc2.txt
29
[Process 5] Read N bytes: Welcome to MyOS Process Management!
30
[Process 6] Read N bytes: Written by process 2 (id=1)
31
[Process 7] Read N bytes: Written by process 3 (id=2)
32

33
[Manager] Final directory listing:
34
  [DIR] data
35
  [FILE] proc1.txt
36
  [FILE] proc2.txt
37
  [FILE] proc3.txt
38
  [FILE] welcome.txt
39

40
=== Process Management Test Complete ===

输出示例说明：

各子系统按顺序初始化：VMM、调度器（含 idle 任务 tid=1）、进程子系统、系统调用（8 个）
manager_task 先创建 /welcome.txt 和 /data 目录
创建 3 个 writer 任务写 /procN.txt，全部完成后继续
创建 3 个 reader 任务读回刚才写的文件
列出根目录，确认文件都落盘
演示结束，manager_task 进入无限让出循环

Note

本章 main() 走的是 manager_task 演示路径，并不调用 sys_fork_impl/sys_exec_impl。fork 与 exec 的实现代码已就绪，但要到 16 章把它们注册进系统调用表后才会真正被触发。上面输出里的 [Process N] 是 manager_task 通过 task_create_kernel 创建的内核任务打印的，tid 由任务子系统分配，与 process_t 的 pid 不是一回事。

踩坑记录#

问题：fork 后子进程不返回 0
- 原因：简化实现共享地址空间，子进程直接执行入口函数
- 解决方案：这是设计的简化，完整实现需要独立地址空间
问题：exec 无法加载 ELF 文件
- 原因：本章只支持 flat binary 格式
- 解决方案：使用 NASM 生成 flat binary：nasm -f bin program.asm -o program.bin
问题：僵尸进程无法被回收
- 原因：wait 系统调用未实现
- 解决方案：实现 wait 系统调用（见课后练习）
问题：fork 创建的进程共享内存
- 原因：简化实现不复制地址空间
- 解决方案：实现完整的 fork（复制页表或使用 COW）

小结#

fork 复制当前进程创建子进程，exec 替换进程的内存映像加载新程序，exit/wait 处理进程的退出和回收，这三者构成了进程的生命周期管理。fork+exec 的分离设计源自 UNIX 哲学：两步操作给了程序员在子进程初始化阶段插入自定义逻辑的灵活性。下一章将完善系统调用框架，实现更多 POSIX 接口，为 Shell 和用户工具提供完整的基础服务。

与完整进程模型的对比：

功能	本章实现	完整 UNIX 进程
进程创建	简化版	完整版
地址空间独立	否，共享页表	是，独立
Copy-on-Write	否	是，按需复制页表
ELF 加载	否，仅 flat binary	是
参数传递 (argv/envp)	否	完整支持
文件描述符	否	继承与重定向
wait/exit	仅 exit	完整实现
进程组/会话	否	完整支持
信号机制	否	完整支持

参考#

第 12 章：用户空间 - TSS 与 Ring 3 切换基础
第 14 章：文件系统 - VFS 与 SimpleFS 实现
Copy-on-Write - 写时复制技术原理
ELF 格式规范 - ELF 可执行文件格式官方规范

进程管理概述#

进程管理的核心机制#

进程结构（process_t）#

进程状态转换#

简化版 fork 系统调用#

简化版 exec 系统调用#

进程退出机制#

代码实现#

文件结构#

进程结构（process_t）#

fork 系统调用流程#

exec 系统调用流程#

fork 子进程入口#

fork 系统调用实现#

exec 系统调用实现#

进程退出实现#

进程创建实现#

运行与验证#

编译运行#

预期输出#

踩坑记录#

小结#

参考#

支持与分享