同步原语：自旋锁、互斥锁与信号量

有了多任务和中断，就出现了并发问题。两个任务同时修改同一块数据，结果取决于谁先执行，这就是竞态条件（race condition）。竞态条件让程序行为变得不可预测，是并发编程中最危险的陷阱。

并发问题与竞态条件#

在多任务环境下，当多个任务同时访问共享变量时，可能会出现竞态条件。看一个简单的例子：

1
// 共享变量
2
int counter = 0;
3

4
// 任务A和任务B都执行这段代码
5
void increment(void) {
6
    counter++;  // 这不是原子操作！
7
}

counter++ 看起来很简单，但编译后实际上包含三步：

读取 counter 到寄存器
寄存器值 +1
写回 counter

如果两个任务同时执行，可能出现：

时间	任务 A	任务 B
T1	读取 counter=0
T2		读取 counter=0
T3	寄存器+1 (=1)
T4		寄存器+1 (=1)
T5	写回 counter=1
T6		写回 counter=1

预期结果应该是 2，但实际结果是 1！这就是竞态条件。为了解决这个问题，需要使用同步原语来保护临界区。

竞态条件的根源是多个执行流同时访问共享数据。最直接的解决方案是让一个执行流在访问时独占，这就是锁的概念。自旋锁是最简单的锁：如果锁已被占用，就不断循环检查（自旋），直到锁释放。

自旋锁（Spinlock）#

自旋锁用于保护非常短的临界区，特别是在中断上下文或不能睡眠的场景中。它通过原子交换操作实现锁的获取，如果锁被占用，获取者会循环检查直到锁可用。自旋锁是一种忙等待锁，其工作流程如下：

flowchart TD A[尝试获取自旋锁] --> B{锁是否空闲?} B -->|是| C[原子交换设置锁] B -->|否| D[循环自旋等待] D --> B C --> E[进入临界区] E --> F[执行临界区代码] F --> G[释放锁] G --> H[设置锁为空闲] H --> I[离开临界区]

1
typedef struct
2
{
3
    volatile uint32_t lock;           // 0: 未锁定, 1: 锁定
4
    volatile uint32_t interrupt_mask; // 保存中断状态（用于中断安全版本）
5
} spinlock_t;
6

7
#define LOCKED_YES 1
8
#define LOCKED_NO 0

自旋锁的核心实现使用了 atomic_exchange 原子操作：

1
/**
2
 * spinlock_lock - 纯线程间抢锁（不能在 ISR 里使用）
3
 * @splock: 锁对象
4
 *
5
 * 使用原子交换操作实现忙等待锁获取
6
 */
7
void spinlock_lock(spinlock_t *splock)
8
{
9
  /* 如果锁已被占用，会一直空转直到持有者释放 */
10
  while (atomic_exchange(&splock->lock, LOCKED_YES) != LOCKED_NO)
11
  {
12
    /* 单核空转时不需要 pause，因为不会有第二个核释放锁 */
13
  }
14
}
15

16
/**
17
 * spinlock_unlock - 释放锁（纯线程版本）
18
 * @splock: 锁对象
19
 *
20
 * 对齐的 32 位写入在 x86 上是原子的，可以直接赋值释放
21
 */
22
void spinlock_unlock(spinlock_t *splock)
23
{
24
  splock->lock = LOCKED_NO;
25
}

atomic_exchange 是一个原子操作，它原子地将新值写入目标地址并返回旧值
如果返回值是 LOCKED_NO（0），说明锁之前是空闲的，我们成功获取了锁
如果返回值是 LOCKED_YES（1），说明锁已被占用，继续循环等待
释放锁时只需将 lock 字段设置为 LOCKED_NO

atomic_exchange 的底层实现是 x86 的 xchg 指令。这条指令在访问内存操作数时隐含 LOCK 前缀，保证总线锁定的原子性。另一种等价写法是 lock cmpxchg（比较交换），在无竞争路径上可以用一次 CAS 原子地完成「测试 + 设置」。本章使用 xchg 因为自旋锁的语义就是无条件交换，不需要先比较。

在可能被中断处理程序访问的临界区中，需要使用带中断保护的版本：

1
/**
2
 * spinlock_lock_irqsave - 带"关中断"功能的抢锁
3
 * @splock: 锁对象
4
 *
5
 * 执行步骤：
6
 * 1. 保存当前 EFLAGS 的 IF 位
7
 * 2. 执行 cli 关闭本地中断
8
 * 3. 用原子交换抢锁
9
 * 4. 解锁时根据 interrupt_mask 决定是否重新 sti
10
 */
11
void spinlock_lock_irqsave(spinlock_t *splock)
12
{
13
  uint32_t eflags = get_eflags();               /* 读取进入前的完整标志寄存器 */
14
  disable_interrupts();                         /* cli：本地 CPU 不再响应 IRQ */
15
  splock->interrupt_mask = (eflags & (1 << 9)); /* 只保留 IF 位 */
16

17
  /* 下面与 spinlock_lock 完全相同 */
18
  while (atomic_exchange(&splock->lock, LOCKED_YES) != LOCKED_NO)
19
  {
20
  }
21
}
22

23
/**
24
 * spinlock_unlock_irqrestore - 释放锁并恢复中断状态
25
 * @splock: 锁对象
26
 *
27
 * 恢复顺序：先放锁 → 再恢复中断，防止在临界区里被中断插进来
28
 */
29
void spinlock_unlock_irqrestore(spinlock_t *splock)
30
{
31
  splock->lock = LOCKED_NO; /* 放锁 */
32
  if (splock->interrupt_mask)
33
  {                      /* 如果进锁前 IF==1，才重新开中断 */
34
    enable_interrupts(); /* sti */
35
  }
36
}

在获取锁前先保存中断状态并关闭中断
防止在临界区内被中断打断而导致死锁
释放锁时根据之前保存的中断状态决定是否重新开中断
保证”谁关谁开”，不会误把外层已关闭的中断重新打开

自旋锁适用于短临界区（持有锁时间非常短，自旋等待的开销小于任务切换）和中断上下文（不能睡眠的环境，中断处理程序不能调用 schedule）。在多核系统上，自旋等待比睡眠更高效，因为其他核可能很快释放锁。

Note

本系列运行在单核 QEMU 上。单核环境中，spinlock_lock（不带关中断版本）有一个隐含约束：如果持锁任务被时钟中断抢占，调度到的另一个任务也尝试获取同一把锁，就会自旋死等，因为持锁任务没有机会运行释放锁。因此单核上自旋锁只适合极短的临界区，且通常配合 spinlock_lock_irqsave 使用来关掉中断，避免抢占。

自旋锁简单粗暴，但有一个问题：如果等待时间较长，自旋会浪费 CPU 时间。互斥锁改进了这一点，当锁不可用时，当前任务主动让出 CPU，进入阻塞状态，等锁释放时再被唤醒。

互斥锁（Mutex）#

互斥锁在锁被占用时会让任务睡眠，而不是自旋等待。这对于持锁时间较长的场景更高效，可以避免 CPU 资源的浪费。互斥锁使用等待队列来管理阻塞的任务，工作流程如下：

flowchart TD A[尝试获取互斥锁] --> B{锁是否空闲?} B -->|是| C[原子交换设置锁] B -->|否| D[加入等待队列] C --> E[获取锁成功] D --> F[设置任务状态为 BLOCKED] F --> G[调用 schedule 切换任务] E --> H[进入临界区] H --> I[执行临界区代码] I --> J[释放锁] J --> K{有等待任务?} K -->|是| L[唤醒第一个等待者] K -->|否| M[设置锁为空闲] L --> N[锁转移给等待者] M --> O[离开临界区]

1
typedef struct mutex
2
{
3
    volatile uint32_t hold;                 // 0: 未锁定, 1: 锁定
4
    volatile struct linked_list_node *thread_node; // 持有者（未来可用于调试）
5
    linked_list_t waiting_task_queue;       // 等待队列
6
    yieldlock_t ydlock;                     // 保护内部状态的锁
7
} mutex_t;

互斥锁的实现使用了 yieldlock（另一种锁机制）来保护内部状态：

1
/**
2
 * mutex_lock - 获取互斥锁
3
 * @mp: 互斥锁对象
4
 *
5
 * 如果锁被占用，将当前任务加入等待队列并阻塞
6
 */
7
void mutex_lock(mutex_t *mp)
8
{
9
    while (1) {
10
        yieldlock_lock(&mp->ydlock);
11

12
        if (atomic_exchange(&mp->hold, LOCKED_YES) == LOCKED_NO) {
13
            /* 成功获取锁 */
14
            yieldlock_unlock(&mp->ydlock);
15
            return;
16
        }
17

18
        /* 获取失败：将当前任务加入等待队列并阻塞 */
19
        task_t *self = current_task();
20
        linked_list_node_t *node = (linked_list_node_t *)kmalloc(sizeof(linked_list_node_t));
21
        if (node != NULL) {
22
            node->ptr = (type_t)self;
23
            node->prev = NULL;
24
            node->next = NULL;
25
            linked_list_append(&mp->waiting_task_queue, node);
26
        }
27

28
        yieldlock_unlock(&mp->ydlock);
29

30
        /* 阻塞当前任务，schedule() 会切换到其他任务 */
31
        task_block(self);
32

33
        /* 被唤醒后重新尝试获取锁 */
34
    }
35
}
36

37
/**
38
 * mutex_unlock - 释放互斥锁
39
 * @mp: 互斥锁对象
40
 *
41
 * 如果有等待者，唤醒队列中的第一个
42
 */
43
void mutex_unlock(mutex_t *mp)
44
{
45
    yieldlock_lock(&mp->ydlock);
46

47
    mp->hold = LOCKED_NO;
48
    mp->thread_node = NULL;
49

50
    /* 如果有等待者，唤醒第一个 */
51
    if (mp->waiting_task_queue.size != 0) {
52
        linked_list_node_t *head = mp->waiting_task_queue.head;
53
        task_t *waiter = (task_t *)head->ptr;
54
        linked_list_remove(&mp->waiting_task_queue, head);
55
        kfree(head);
56

57
        yieldlock_unlock(&mp->ydlock);
58

59
        task_unblock(waiter);
60
    } else {
61
        yieldlock_unlock(&mp->ydlock);
62
    }
63
}

mutex_lock 使用 atomic_exchange 尝试获取锁
如果锁已被占用，将当前任务加入等待队列并调用 task_block 阻塞
阻塞后的任务会被调度器切换出去，不会占用 CPU 资源
mutex_unlock 检查是否有等待者，如果有则唤醒第一个等待者
注意：锁会直接转移给等待者，而不是释放锁让等待者重新竞争

Important

互斥锁和信号量会调用 task_block 让当前任务进入阻塞态，这依赖调度器切换到其他任务。中断处理程序不能被阻塞，因此互斥锁和信号量只能在任务上下文中使用，不能在 ISR 中调用。中断上下文中的临界区保护只能用 spinlock_lock_irqsave。

互斥锁只能保护互斥访问（0 或 1），但有时需要更灵活的同步，比如限制同时访问的资源数量。信号量通过计数器实现了这种能力。

信号量（Semaphore）#

信号量是一个计数器，用于控制对资源的访问数量。初始值为 1 时等同于互斥访问，大于 1 时用于资源池管理。信号量通过 P 操作（wait）和 V 操作（signal）来管理资源：

flowchart TD subgraph P操作["P操作 (sem_wait)"] A1[尝试获取资源] --> B1{"count > 0?"} B1 -->|是| C1[count--] B1 -->|否| D1[加入等待队列] C1 --> E1[获取资源成功] D1 --> F1[阻塞当前任务] end subgraph V操作["V操作 (sem_signal)"] A2[释放资源] --> B2{有等待者?} B2 -->|是| C2[唤醒第一个等待者] B2 -->|否| D2[count++] C2 --> E2[等待者获取资源] D2 --> F2[增加可用资源] end

1
typedef struct semaphore {
2
    volatile int count;            // 可用资源数量
3
    linked_list_t wait_queue;      // 等待队列
4
    spinlock_t lock;              // 保护内部状态
5
} semaphore_t;

信号量的实现清晰地展示了 P/V 操作的语义：

1
/**
2
 * sem_init - 初始化信号量
3
 * @sem: 信号量对象
4
 * @initial_count: 初始资源数量
5
 */
6
void sem_init(semaphore_t *sem, int initial_count)
7
{
8
    sem->count = initial_count;
9
    linked_list_init(&sem->wait_queue);
10
    spinlock_init(&sem->lock);
11
}
12

13
/**
14
 * sem_wait - P 操作：等待/获取资源
15
 * @sem: 信号量对象
16
 *
17
 * 如果有资源可用，递减计数；否则阻塞当前任务
18
 */
19
void sem_wait(semaphore_t *sem)
20
{
21
    spinlock_lock(&sem->lock);
22

23
    if (sem->count > 0) {
24
        /* 有资源可用，直接获取 */
25
        sem->count--;
26
        spinlock_unlock(&sem->lock);
27
        return;
28
    }
29

30
    /* count == 0：将当前任务加入等待队列并阻塞 */
31
    task_t *self = current_task();
32
    linked_list_node_t *node = (linked_list_node_t *)kmalloc(sizeof(linked_list_node_t));
33
    if (node != NULL) {
34
        node->ptr = (type_t)self;
35
        node->prev = NULL;
36
        node->next = NULL;
37
        linked_list_append(&sem->wait_queue, node);
38
    }
39

40
    spinlock_unlock(&sem->lock);
41
    task_block(self);
42
}
43

44
/**
45
 * sem_signal - V 操作：释放/增加资源
46
 * @sem: 信号量对象
47
 *
48
 * 如果有等待者，唤醒一个；否则递增计数
49
 */
50
void sem_signal(semaphore_t *sem)
51
{
52
    spinlock_lock(&sem->lock);
53

54
    if (sem->wait_queue.size > 0) {
55
        /* 有等待者，唤醒第一个 */
56
        linked_list_node_t *head = sem->wait_queue.head;
57
        task_t *waiter = (task_t *)head->ptr;
58
        linked_list_remove(&sem->wait_queue, head);
59
        kfree(head);
60

61
        spinlock_unlock(&sem->lock);
62
        task_unblock(waiter);
63
    } else {
64
        /* 没有等待者，增加资源计数 */
65
        sem->count++;
66
        spinlock_unlock(&sem->lock);
67
    }
68
}

sem_wait（P 操作）首先检查 count 是否大于 0
如果有资源可用，递减计数并立即返回
如果没有资源，将当前任务加入等待队列并阻塞
sem_signal（V 操作）检查是否有等待者
如果有等待者，唤醒第一个等待者（不增加计数，资源直接转移）
如果没有等待者，递增计数表示资源增加

经典应用：生产者-消费者#

信号量的经典应用场景是生产者-消费者问题：

1
#define BUFFER_SIZE 4
2
static int buffer[BUFFER_SIZE];
3
static int buf_in = 0, buf_out = 0;
4
static semaphore_t sem_empty;  // 空槽位数量
5
static semaphore_t sem_full;   // 已填充槽位数量
6
static spinlock_t buf_lock;    // 保护缓冲区
7

8
// 初始化
9
sem_init(&sem_empty, BUFFER_SIZE);  // 初始有 BUFFER_SIZE 个空槽位
10
sem_init(&sem_full, 0);             // 初始没有已填充的槽位
11
spinlock_init(&buf_lock);
12

13
void producer(void *arg) {
14
    int id = (int)(uint32_t)arg;
15
    for (int i = 0; i < 8; i++) {
16
        int item = id * 100 + i;
17
        sem_wait(&sem_empty);   // 等待空槽位
18
        spinlock_lock(&buf_lock);
19
        buffer[buf_in] = item;
20
        buf_in = (buf_in + 1) % BUFFER_SIZE;
21
        spinlock_unlock(&buf_lock);
22
        sem_signal(&sem_full);  // 增加已填充槽位
23
        schedule_yield();
24
    }
25
    task_exit(0);
26
}
27

28
void consumer(void *arg) {
29
    for (int i = 0; i < 16; i++) {
30
        sem_wait(&sem_full);    // 等待数据
31
        spinlock_lock(&buf_lock);
32
        int item = buffer[buf_out];
33
        buf_out = (buf_out + 1) % BUFFER_SIZE;
34
        spinlock_unlock(&buf_lock);
35
        sem_signal(&sem_empty);  // 增加空槽位
36
        schedule_yield();
37
    }
38
    task_exit(0);
39
}

sem_empty 信号量控制缓冲区的空槽位数量
sem_full 信号量控制缓冲区的已填充槽位数量
生产者等待空槽位，消费者等待已填充槽位
自旋锁 buf_lock 保护缓冲区的实际读写操作
这种模式确保了生产者不会写入已满的缓冲区，消费者不会读取空的缓冲区

代码实现#

文件结构#

11.kernel-sync

boot

mbr.S

loader.S

kernel

include

spinlock.h

mutex.h

semaphore.h

yieldlock.h

lock.h

…

sync

spinlock.c

lock.S

mutex.c

semaphore.c

yieldlock.c

kernel.c

Makefile

自旋锁获取流程#

sequenceDiagram participant Task1 as 任务1 participant Task2 as 任务2 participant Lock as 自旋锁 Task1->>Lock: atomic_exchange(&lock, 1) Lock-->>Task1: 返回 0（成功） Note over Task1: 获取锁，进入临界区 Task2->>Lock: atomic_exchange(&lock, 1) Lock-->>Task2: 返回 1（失败） Task2->>Task2: 循环自旋等待 Task1->>Lock: lock = 0（释放锁） Note over Task1: 离开临界区 Task2->>Lock: atomic_exchange(&lock, 1) Lock-->>Task2: 返回 0（成功） Note over Task2: 获取锁，进入临界区

互斥锁阻塞唤醒流程#

sequenceDiagram participant Task1 as 任务1（持有者） participant Task2 as 任务2（等待者） participant Mutex as 互斥锁 participant Scheduler as 调度器 Task1->>Mutex: atomic_exchange(&hold, 1) Note over Task1: 获取锁，进入临界区 Task2->>Mutex: atomic_exchange(&hold, 1) Mutex-->>Task2: 返回 1（失败） Task2->>Task2: 加入等待队列 Task2->>Task2: task_block(self) Task2->>Scheduler: 切换任务 Note over Task2: 被阻塞，不占用 CPU Task1->>Mutex: 释放锁 Mutex->>Task2: task_unblock(waiter) Mutex->>Scheduler: 加入就绪队列 Note over Task1: 离开临界区 Scheduler->>Task2: 调度运行 Task2->>Mutex: 重新尝试获取锁 Note over Task2: 获取成功，进入临界区

三种同步原语的对比#

特性	自旋锁（Spinlock）	互斥锁（Mutex）	信号量（Semaphore）
等待方式	忙等待（自旋）	阻塞（睡眠）	阻塞（睡眠）
适用场景	短临界区、中断上下文	长临界区、普通任务	资源计数、生产者-消费者
CPU 开销	高（自旋时占用 CPU）	低（阻塞时不占用 CPU）	低（阻塞时不占用 CPU）
资源数	1（互斥）	1（互斥）	N（可配置）
实现复杂度	简单（原子操作）	中等（等待队列）	中等（计数+队列）
中断安全	需要特殊版本	不适用于中断	不适用于中断

运行与验证#

编译运行#

1
cd 11.kernel-sync
2
make clean
3
make all
4
make run

预期输出#

1
=== Chapter 11: Kernel Synchronization ===
2

3
--- Creating test tasks ---
4

5
Starting scheduler...
6

7
[Spinlock] Task 1 done
8
[Spinlock] Task 2 done
9
[Spinlock] Task 3 done
10
[Mutex] Task 1 done (counter=150)
11
[Mutex] Task 2 done (counter=150)
12
[Mutex] Task 3 done (counter=150)
13
[Producer 1] put 100
14
[Producer 2] put 200
15
[Consumer] got 100
16
[Producer 1] put 101
17
...
18
[Consumer] got 208
19

20
=== Results ===
21
Unprotected counter: 233 (expected 300, may differ)
22
Protected counter:   300 (expected 300)
23
Mutex counter:       150 (expected 150)
24

25
All sync tests complete.

测试要点#

自旋锁测试：验证无锁情况下的竞态条件和有锁情况下的正确性
互斥锁测试：验证任务的正确阻塞和唤醒
信号量测试：验证生产者-消费者模式的数据正确性

踩坑记录#

1. 死锁（Deadlock）#

问题原因：任务 A 持有锁 1 等待锁 2，任务 B 持有锁 2 等待锁 1

1
// 错误示例
2
void task_a(void) {
3
    mutex_lock(&lock1);
4
    mutex_lock(&lock2);
5
    /* ... */
6
    mutex_unlock(&lock2);
7
    mutex_unlock(&lock1);
8
}
9

10
void task_b(void) {
11
    mutex_lock(&lock2);  // 锁的获取顺序与 task_a 不同！
12
    mutex_lock(&lock1);
13
    /* ... */
14
    mutex_unlock(&lock1);
15
    mutex_unlock(&lock2);
16
}

解决方案：统一锁的获取顺序，所有任务都以相同的顺序获取锁

1
// 正确示例：所有任务都先获取 lock1，再获取 lock2
2
void task_a(void) {
3
    mutex_lock(&lock1);
4
    mutex_lock(&lock2);
5
    /* ... */
6
    mutex_unlock(&lock2);
7
    mutex_unlock(&lock1);
8
}
9

10
void task_b(void) {
11
    mutex_lock(&lock1);  // 与 task_a 相同的顺序
12
    mutex_lock(&lock2);
13
    /* ... */
14
    mutex_unlock(&lock2);
15
    mutex_unlock(&lock1);
16
}

2. 优先级反转（Priority Inversion）#

问题原因：低优先级任务持有锁，高优先级任务等待，中优先级任务抢占低优先级任务

解决方案：优先级继承协议，当高优先级任务等待低优先级任务持有的锁时，临时提升低优先级任务的优先级

3. 中断中的死锁#

问题原因：中断处理程序尝试获取已被任务持有的锁，导致死锁

解决方案：使用 spinlock_lock_irqsave 和 spinlock_unlock_irqrestore，在获取锁前先关闭中断

1
// 错误示例
2
void interrupt_handler(void) {
3
    spinlock_lock(&lock);  // 如果任务A持有这个锁，会死锁！
4
    /* ... */
5
    spinlock_unlock(&lock);
6
}

1
// 正确示例
2
void interrupt_handler(void) {
3
    spinlock_lock_irqsave(&lock);  // 关中断再抢锁
4
    /* ... */
5
    spinlock_unlock_irqrestore(&lock);  // 恢复中断状态
6
}

下一章将进入用户空间，实现特权级切换和系统调用框架，届时中断安全的自旋锁会再次出场。

参考#

Spinlocks vs Mutexes - Linux 内核文档
Dining Philosophers Problem - 哲学家就餐问题