Go 协程与通道：CSP 模型实现

1. CSP 模型：Go 并发的理论基础#

1.1 什么是 CSP？#

CSP（Communicating Sequential Processes，通信顺序进程）是由 Tony Hoare 于 1978 年提出的并发编程理论。其思想是：

不要通过共享内存来通信，而要通过通信来共享内存。

Go 语言的并发设计深受 CSP 影响，通过以下两个原语实现了这一模型：

goroutine：轻量级的并发执行单元
channel：goroutine 之间的通信管道

1.2 传统并发模型 vs CSP 模型#

传统并发模型（共享内存）：多个线程通过共享内存交换数据，需要显式加锁来避免竞争。锁的粒度选择困难，过粗则并发度低，过细则容易死锁。

CSP 模型（消息传递）：goroutine 通过 channel 传递数据，通信本身即同步。发送方和接收方不需要知道对方的存在，只通过 channel 间接完成协调。

graph LR subgraph "共享内存模型" TA["Thread A"] --> SM["共享内存 + 锁机制"] TB["Thread B"] --> SM end subgraph "CSP 模型" GA["goroutine A"] --> CH["channel"] --> GB["goroutine B"] end

2. Goroutine：轻量级并发单元#

2.1 goroutine 的创建：newproc#

当使用 go func() 启动一个 goroutine 时，编译器会将其转换为对 runtime.newproc 的调用：

1
// 用户代码
2
go hello()
3

4
// 编译后的等价代码
5
runtime.newproc(hello)

newproc 的实现：

1
// src/runtime/proc.go — https://github.com/golang/go/blob/go1.25.0/src/runtime/proc.go
2
func newproc(fn *funcval) {
3
    gp := getg()
4
    pc := getcallerpc()
5
    systemstack(func() {
6
        newg := newproc1(fn, gp, pc)
7

8
        // 获取当前 P
9
        pp := gp.m.p.ptr()
10

11
        // 将新 G 放入运行队列
12
        runqput(pp, newg, true)
13

14
        // 如果有空闲 P，尝试唤醒或创建 M
15
        if mainStarted {
16
            wakep()
17
        }
18
    })
19
}

newproc1 负责创建新的 goroutine 结构：

1
func newproc1(fn *funcval, callergp *g, callerpc uintptr) *g {
2
    pp := callergp.m.p.ptr()
3

4
    // 尝试从 P 的空闲列表获取 G（复用）
5
    newg := pp.gfree
6
    if newg == nil {
7
        // 没有 G 可复用，创建新的
8
        newg = malg(stackMin) // stackMin = 2048 字节
9
    }
10

11
    // 计算栈空间并初始化
12
    totalSize := uintptr(4*goarch.PtrSize + sys.MinFrameSize)
13
    totalSize = alignUp(totalSize, sys.StackAlign)
14

15
    // 设置 goroutine 的入口函数
16
    sp := newg.stack.hi - totalSize
17
    memclrNoHeapPointers(sp, totalSize)
18

19
    // 初始化调度上下文
20
    newg.sched.sp = sp
21
    newg.sched.pc = abi.FuncPCABI0(goexit) + sys.PCQuantum
22
    newg.sched.g = guintptr(unsafe.Pointer(newg))
23

24
    // 设置真正的入口函数
25
    gostartcallfn(&newg.sched, fn)
26

27
    // 设置状态为 _Grunnable
28
    newg.atomicstatus = _Grunnable
29

30
    return newg
31
}

2.2 goroutine 的状态转换#

goroutine 在其生命周期中会经历多个状态：

stateDiagram-v2 [*] --> _Gidle : newproc _Gidle --> _Grunnable : 入队 _Grunnable --> _Grunning : schedule _Grunning --> _Gsyscall : 系统调用 _Grunning --> _Gwaiting : channel/lock/timer 等待 _Grunning --> _Gcopystack : 栈扩展/收缩 _Grunning --> _Gdead : goexit _Gsyscall --> _Grunnable : 系统调用返回 _Gwaiting --> _Grunnable : 等待结束 _Gcopystack --> _Grunning : 栈调整完成 _Gdead --> _Gidle : 复用池回收

2.3 goroutine 的销毁#

当 goroutine 执行完毕，会调用 goexit：

1
// src/runtime/proc.go — https://github.com/golang/go/blob/go1.25.0/src/runtime/proc.go
2
func goexit() {
3
    // 切换到 g0 执行清理
4
    mcall(goexit0)
5
}
6

7
func goexit0(gp *g) {
8
    mp := getg().m
9
    pp := mp.p.ptr()
10

11
    // 重置 goroutine 状态
12
    casgstatus(gp, _Grunning, _Gdead)
13
    gp.m = nil
14

15
    // 解绑 M
16
    mp.curg = nil
17

18
    // 将 G 放入 P 的空闲列表（复用）
19
    pp.gfree = gp
20
    pp.gfree++
21

22
    // 重新调度
23
    schedule()
24
}

Note

goroutine 不会立即释放，而是放入 P 的空闲列表，供后续复用。这避免了频繁的内存分配开销。

3. Channel：goroutine 之间的通信管道#

Channel 通信架构#

graph TD subgraph "hchan 结构体" BCOUNT["buf: 循环缓冲区（有缓冲 channel）"] QSEND["sendq: 等待发送的 G 队列"] QRECV["recvq: 等待接收的 G 队列"] LOCK["lock: 互斥锁"] CNT["count: 缓冲区元素数"] end subgraph "发送流程" S1["ch <- x"] --> S2{"缓冲区未满？"} S2 --> |"是"| S3["写入缓冲区"] S2 --> |"否"| S4["挂起 G 到 sendq"] end subgraph "接收流程" R1["<- ch"] --> R2{"缓冲区非空？"} R2 --> |"是"| R3["从缓冲区读取"] R2 --> |"否"| R4["挂起 G 到 recvq"] end style BCOUNT fill:#4CAF50,color:#fff style S4 fill:#FF9800,color:#fff style R4 fill:#FF9800,color:#fff

Channel 通信模式#

3.1 hchan：channel 的底层数据结构#

channel 在运行时由 hchan 结构体表示：

1
// src/runtime/chan.go — https://github.com/golang/go/blob/go1.25.0/src/runtime/chan.go
2
type hchan struct {
3
    qcount   uint           // 队列中的元素数量
4
    dataqsiz uint           // 循环队列的大小（缓冲区容量）
5
    buf      unsafe.Pointer // 指向循环队列的指针（仅缓冲 channel）
6
    elemsize uint16         // 每个元素的大小
7
    closed   uint32         // channel 是否已关闭
8
    elemtype *_type         // 元素类型信息
9

10
    sendx    uint           // 发送索引
11
    recvx    uint           // 接收索引
12

13
    recvq    waitq          // 等待接收的 goroutine 队列
14
    sendq    waitq          // 等待发送的 goroutine 队列
15

16
    lock     mutex          // 互斥锁，保护 hchan 的所有字段
17
}
18

19
type waitq struct {
20
    first *sudog  // 队列头
21
    last  *sudog  // 队列尾
22
}

Note

上面是 hchan 的核心字段简化版。在 go1.25 的实际源码中，hchan 还有 timer *timer（用于 chan 与 runtime timer 集成的超时控制）和 bubble *synctestBubble（testing/synctest 包的同步气泡）等字段，后文 GC 扫描部分会用到它们。

channel 的 FIFO 语义与历史演进#

channel 的收发操作遵循先进先出（FIFO）语义：先发送数据的 goroutine 先获得发送权，先等待接收的 goroutine 先接收到数据。但这个语义不是从一开始就严格保证的。

在早期版本中，带缓冲区的 channel 使用一种”基于重试”的机制：发送方写入缓冲区后唤醒接收方，多个接收方尝试读取，没读到的重新休眠；反之亦然。这种机制在高并发下不保证 FIFO。经过两个关键提交（runtime: simplify buffered channels 和 runtime: simplify chan ops, take 2），带缓冲区和不带缓冲区的 channel 都严格遵循了 FIFO 语义。

为什么 channel 是”有锁”而非”无锁”？#

hchan 结构体中有一个 mutex 字段，这说明 channel 本质上是一个有锁队列。社区在 2014 年曾提出无锁 channel 方案，将 channel 分为三种类型：

同步 channel：不需要缓冲区，发送方直接将数据交给接收方（handoff）
异步 channel：基于环形缓存的传统生产者消费者模型
chan struct{} 类型的异步 channel：struct{} 不占内存，不需要缓冲区

这个提案的目标是在关键路径上通过 CAS 减少锁的使用。但实测中，基于 CAS 的无锁实现在多核场景下无法保证 FIFO，性能提升也不稳定，因此该提案被搁置。Go 团队选择了更务实的路线：用 mutex 保证正确性，通过编译器优化（内联 fast path）减少热路径的锁开销。

来源：draven.co - Channel 设计原理

1
type sudog struct {
2
    g       *g              // 等待的 goroutine
3
    elem    unsafe.Pointer  // 数据指针
4
    next    *sudog
5
    prev    *sudog
6
    // ...
7
}

3.2 channel 创建#

make(chan T, N) 会被编译器经过两步转换：类型检查阶段将 OMAKE 节点转为 OMAKECHAN，SSA 中间代码生成阶段将其转为对 runtime.makechan（缓冲区大小 ≤ 2³²-1）或 runtime.makechan64（更大缓冲区）的调用。

makechan 根据元素类型和缓冲区大小选择不同的内存分配策略：

1
func makechan(t *chantype, size int) *hchan {
2
    elem := t.Elem
3

4
    // 计算需要的内存大小
5
    mem, overflow := math.MulUintptr(elem.Size_, uintptr(size))
6

7
    var c *hchan
8
    switch {
9
    case mem == 0:
10
        // 无缓冲 channel
11
        c = (*hchan)(mallocgc(hchanSize, nil, true))
12

13
    case elem.PtrBytes == 0:
14
        // 元素不包含指针，可以一次性分配
15
        c = (*hchan)(mallocgc(hchanSize+mem, nil, true))
16
        c.buf = add(unsafe.Pointer(c), hchanSize)
17

18
    default:
19
        // 元素包含指针，需要单独分配缓冲区
20
        c = new(hchan)
21
        c.buf = mallocgc(mem, elem, true)
22
    }
23

24
    c.elemsize = uint16(elem.Size_)
25
    c.elemtype = elem
26
    c.dataqsiz = uint(size)
27

28
    return c
29
}

3.3 channel 发送原理#

ch <- x 会被编译为 runtime.chansend1 ，最终调用 chansend：

1
func chansend(c *hchan, block bool, elem unsafe.Pointer) bool {
2
    // 加锁
3
    lock(&c.lock)
4

5
    // 检查 channel 是否已关闭
6
    if c.closed != 0 {
7
        unlock(&c.lock)
8
        panic("send on closed channel")
9
    }
10

11
    // 情况 1：有等待接收的 goroutine
12
    if sg := c.recvq.dequeue(); sg != nil {
13
        // 直接发送给等待者
14
        send(c, sg, elem, true)
15
        unlock(&c.lock)
16
        return true
17
    }

send() 函数是直接发送路径的核心，它绕过缓冲区，将数据直接拷贝到接收方的内存地址：

1
func send(c *hchan, sg *sudog, ep unsafe.Pointer, unlockf func(), skip int) {
2
    // 将数据直接拷贝到接收方变量 x 的内存地址
3
    if sg.elem != nil {
4
        sendDirect(c.elemtype, sg, ep)
5
        sg.elem = nil
6
    }
7
    gp := sg.g
8
    unlockf()
9
    gp.param = unsafe.Pointer(sg)
10
    // 将接收方 G 标记为 Grunnable，放入 P 的 runnext
11
    goready(gp, skip+1)
12
}

注意，goready 只是将接收方放入 runnext，并不会立刻触发调度。真正的执行要等到当前 G 让出处理器。

1
    // 情况 2：缓冲区还有空间
2
    if c.qcount < c.dataqsiz {
3
        // 放入缓冲区
4
        qp := chanbuf(c, c.sendx)
5
        typedmemmove(c.elemtype, qp, elem)
6
        c.sendx++
7
        if c.sendx == c.dataqsiz {
8
            c.sendx = 0
9
        }
10
        c.qcount++
11
        unlock(&c.lock)
12
        return true
13
    }
14

15
    // 情况 3：非阻塞模式直接返回
16
    if !block {
17
        unlock(&c.lock)
18
        return false
19
    }
20

21
    // 情况 4：阻塞等待
22
    gp := getg()
23
    mysg := acquireSudog()
24
    mysg.g = gp
25
    mysg.elem = elem
26

27
    c.sendq.enqueue(mysg)
28

29
    // 等待唤醒
30
    gopark(chanparkcommit, unsafe.Pointer(&c.lock), waitReasonChanSend, traceBlockChanSend, 2)
31

32
    // 被唤醒后继续执行
33
    releaseSudog(mysg)
34
    return true
35
}

发送流程图：

flowchart TD Start["ch <- x"] --> Closed{"channel 已关闭?"} Closed -->|是| Panic["panic: send on closed channel"] Closed -->|否| RecvWait{"recvq 有等待者?"} RecvWait -->|有| DirectSend["直接发送到接收者\n唤醒对方 sudog"] RecvWait -->|无| BufSpace{"缓冲区有空位?"} BufSpace -->|有| Enqueue["放入缓冲区\nsendx++，qcount++"] BufSpace -->|无| NonBlock{"非阻塞模式?"} NonBlock -->|是| RetFalse["返回 false"] NonBlock -->|否| Block["当前 G 封装为 sudog\n入队 sendq，阻塞等待"]

3.4 channel 接收原理#

x := <-ch 会被编译为 runtime.chanrecv1 或 chanrecv2 （带 ok 返回值）：

1
func chanrecv(c *hchan, block bool, elem unsafe.Pointer) (received bool) {
2
    lock(&c.lock)
3

4
    // 情况 1：channel 已关闭且缓冲区为空
5
    if c.closed != 0 && c.qcount == 0 {
6
        unlock(&c.lock)
7
        if elem != nil {
8
            // 清零目标位置
9
            memclrNoHeapPointers(elem, c.elemsize)
10
        }
11
        return false
12
    }
13

14
    // 情况 2：有等待发送的 goroutine
15
    if sg := c.sendq.dequeue(); sg != nil {
16
        // 从发送者接收数据
17
        recv(c, sg, elem, true)
18
        unlock(&c.lock)
19
        return true
20
    }

recv() 函数的行为取决于 channel 是否有缓冲区：

1
func recv(c *hchan, sg *sudog, ep unsafe.Pointer, unlockf func(), skip int) {
2
    if c.dataqsiz == 0 {
3
        // 无缓冲 channel：直接从发送方拷贝到接收方
4
        if ep != nil {
5
            recvDirect(c.elemtype, sg, ep)
6
        }
7
    } else {
8
        // 有缓冲 channel：先从缓冲区取数据给接收方
9
        // 再把发送方数据补到缓冲区空出的位置
10
        qp := chanbuf(c, c.recvx)
11
        if ep != nil {
12
            typedmemmove(c.elemtype, ep, qp)
13
        }
14
        typedmemmove(c.elemtype, qp, sg.elem)
15
        c.recvx++
16
        c.sendx = c.recvx  // 等价于 (c.sendx+1) % c.dataqsiz
17
    }
18
    gp := sg.g
19
    gp.param = unsafe.Pointer(sg)
20
    goready(gp, skip+1)
21
}

有缓冲 channel 的 recv 路径比较巧妙：先从 recvx 位置取出数据给接收方，再把阻塞发送方的数据补到这个空位上，然后递增 recvx 和 sendx。这样既保证了 FIFO，又释放了一个缓冲区空位。

1
// 情况 3：缓冲区有数据
2
if c.qcount > 0 {
3
    qp := chanbuf(c, c.recvx)
4
    if elem != nil {
5
        typedmemmove(c.elemtype, elem, qp)
6
    }
7
    memclrNoHeapPointers(qp, c.elemsize)
8
    c.recvx++
9
    if c.recvx == c.dataqsiz {
10
        c.recvx = 0
11
    }
12
    c.qcount--
13
    unlock(&c.lock)
14
    return true
15
}
16

17
// 情况 4：非阻塞模式
18
if !block {
19
    unlock(&c.lock)
20
    return false
21
}
22

23
// 情况 5：阻塞等待
24
gp := getg()
25
mysg := acquireSudog()
26
mysg.g = gp
27
mysg.elem = elem
28

29
c.recvq.enqueue(mysg)
30

31
gopark(chanparkcommit, unsafe.Pointer(&c.lock), waitReasonChanReceive, traceBlockChanRecv, 2)
32

33
releaseSudog(mysg)
34
return true

}

1
### 3.5 有缓冲 vs 无缓冲通道
2

3
**无缓冲通道**（unbuffered channel）：
4

5
```mermaid
6
graph LR
7
    G1["G1 (发送者)<br/>ch &lt;- x"] -->|"阻塞直到对方就绪"| Sync["同步点<br/>(握手)"]
8
    Sync -->|"阻塞直到对方就绪"| G2["G2 (接收者)<br/>&lt;- ch"]

发送和接收必须同时准备好，否则阻塞。sendq 或 recvq 最多有一个非空。

有缓冲通道（buffered channel）：

graph LR G1["G1 (发送者) ch <- z"] -->|"缓冲区未满即可写入"| Buf["buf: [x][y][ ] sendx=2, recvx=0 qcount=2"] Buf -->|"缓冲区非空即可读取"| G2["G2 (接收者) <- ch"]

缓冲区未满时可发送，非空时可接收。sendq 和 recvq 可能同时为空。

3.6 channel 关闭#

close(ch) 调用 runtime.closechan：

1
func closechan(c *hchan) {
2
    lock(&c.lock)
3

4
    // 不能关闭已关闭的 channel
5
    if c.closed != 0 {
6
        unlock(&c.lock)
7
        panic("close of closed channel")
8
    }
9

10
    c.closed = 1
11

12
    // 唤醒所有等待接收的 goroutine
13
    var glist gList
14
    for {
15
        sg := c.recvq.dequeue()
16
        if sg == nil {
17
            break
18
        }
19
        sg.elem = nil
20
        glist.push(sg.g)
21
    }
22

23
    // 唤醒所有等待发送的 goroutine（会 panic）
24
    for {
25
        sg := c.sendq.dequeue()
26
        if sg == nil {
27
            break
28
        }
29
        sg.elem = nil
30
        glist.push(sg.g)
31
    }
32
    unlock(&c.lock)
33

34
    // 唤醒所有 goroutine
35
    for !glist.empty() {
36
        gp := glist.pop()
37
        gp.schedlink = 0
38
        goready(gp, 3)
39
    }
40
}

关闭 channel 的规则：

操作	nil channel	已关闭的 channel	正常 channel
发送	永久阻塞	panic	正常发送或阻塞
接收	永久阻塞	返回零值，ok=false	正常接收或阻塞
关闭	panic	panic	正常关闭

4. Select：多路复用#

4.1 select 的实现原理#

select 语句用于同时监听多个 channel 操作。Go 编译器会将 select 转换为对 runtime.selectgo 的调用：

1
// 用户代码
2
select {
3
case v := <-ch1:
4
    // ...
5
case ch2 <- x:
6
    // ...
7
default:
8
    // ...
9
}
10

11
// 编译后的结构
12
var cases []scase
13
cases[0] = scase{kind: caseRecv, c: ch1, elem: &v}
14
cases[1] = scase{kind: caseSend, c: ch2, elem: &x}
15
cases[2] = scase{kind: caseDefault}
16
chosen, _ := selectgo(cases, ...)

4.2 scase 结构#

1
type scase struct {
2
    c    *hchan         // channel
3
    elem unsafe.Pointer // 数据指针
4
    kind uint16         // case 类型
5
}
6

7
const (
8
    caseNil = iota
9
    caseRecv
10
    caseSend
11
    caseDefault
12
)

4.3 selectgo 逻辑#

1
func selectgo(cas0 *scase, order0 *uint16, ...) (int, bool) {
2
    // 1. 打乱 case 顺序（公平性）
3
    ncases := len(cases)
4
    order := order0[:2*ncases]
5
    for i := 0; i < ncases; i++ {
6
        order[i] = uint16(i)
7
    }
8
    // Fisher-Yates 洗牌
9
    for i := ncases - 1; i > 0; i-- {
10
        j := fastrandn(i + 1)
11
        order[i], order[j] = order[j], order[i]
12
    }
13

14
    // 2. 第一遍扫描：检查是否有 case 可以立即执行
15
    for i := 0; i < ncases; i++ {
16
        cas := &cases[order[i]]
17
        switch cas.kind {
18
        case caseRecv:
19
            if c.qcount > 0 || c.closed != 0 {
20
                // 可以接收
21
                return int(order[i]), c.qcount > 0
22
            }
23
        case caseSend:
24
            if c.qcount < c.dataqsiz || c.recvq.first != nil {
25
                // 可以发送
26
                return int(order[i]), false
27
            }
28
        case caseDefault:
29
            return int(order[i]), false
30
        }
31
    }
32

33
    // 3. 没有 case 可立即执行，将当前 G 加入所有 channel 的等待队列
34
    gp := getg()
35
    for i := 0; i < ncases; i++ {
36
        cas := &cases[i]
37
        if cas.kind == caseRecv {
38
            c.recvq.enqueue(sudog{g: gp})
39
        } else if cas.kind == caseSend {
40
            c.sendq.enqueue(sudog{g: gp})
41
        }
42
    }
43

44
    // 4. 阻塞等待
45
    gopark(nil, nil, waitReasonSelect, traceBlockSelect, 1)
46

47
    // 5. 被唤醒，找到是哪个 case
48
    // ... 清理其他等待队列，返回结果
49
}

4.4 select 流程图#

flowchart TD Start["select 开始"] --> Shuffle["打乱 case 顺序\n(随机公平)"] Shuffle --> Scan1["第一遍扫描(不阻塞)"] Scan1 --> Executable{"有可执行的 case?"} Executable -->|有| RunCase["执行该 case，返回"] Executable -->|没有| HasDefault{"有 default?"} HasDefault -->|有| RunDefault["执行 default，返回"] HasDefault -->|没有| Enqueue["将 G 加入所有 channel 的等待队列"] Enqueue --> Block["阻塞等待"] Block --> Wakeup["被唤醒"] Wakeup --> Cleanup["清理其他等待队列\n返回结果"]

5. 通道方向与类型安全#

5.1 单向通道#

Go 支持声明单向通道类型，用于类型检查：

1
// 只发送通道
2
func sendOnly(ch chan<- int) {
3
    ch <- 42
4
}
5

6
// 只接收通道
7
func receiveOnly(ch <-chan int) int {
8
    return <-ch
9
}
10

11
// 双向通道可以隐式转换为单向通道
12
func main() {
13
    ch := make(chan int)
14
    sendOnly(ch)    // chan int -> chan<- int
15
    receiveOnly(ch) // chan int -> <-chan int
16
}

Note

单向通道是类型系统的约束，底层 hchan 结构完全相同。编译器会阻止错误的操作。

5.2 类型安全的好处#

1
type ChannelConfig struct {
2
    Send    chan<- Data   // 只能发送
3
    Receive <-chan Data   // 只能接收
4
}
5

6
// 编译时检查
7
func process(ch ChannelConfig) {
8
    // ch.Send <- data   // 正确
9
    // <-ch.Send         // 编译错误：不能从发送通道接收
10
    // ch.Receive <- data // 编译错误：不能向接收通道发送
11
    // data := <-ch.Receive // 正确
12
}

6. 常见并发模式#

6.1 Fan-Out（扇出）#

一个生产者，多个消费者：

graph TD P["Producer"] --> Ch["Channel"] Ch --> W1["Worker 1 (Consumer)"] Ch --> W2["Worker 2 (Consumer)"] Ch --> W3["Worker 3 (Consumer)"]

实现示例：

1
func fanOut(jobs <-chan Task, workers int) []<-chan Result {
2
    results := make([]<-chan Result, workers)
3
    for i := 0; i < workers; i++ {
4
        results[i] = worker(jobs)
5
    }
6
    return results
7
}
8

9
func worker(jobs <-chan Task) <-chan Result {
10
    out := make(chan Result)
11
    go func() {
12
        defer close(out)
13
        for job := range jobs {
14
            out <- process(job)
15
        }
16
    }()
17
    return out
18
}

6.2 Pipeline（管道）#

多个处理阶段串联：

graph LR S1["Stage 1 Generator chan A"] --> S2["Stage 2 Transform chan B"] --> S3["Stage 3 Consumer chan C"]

实现示例：

1
func pipeline() {
2
    // Stage 1: 生成数据
3
    nums := generate(1, 2, 3, 4, 5)
4

5
    // Stage 2: 平方
6
    squares := square(nums)
7

8
    // Stage 3: 打印
9
    for s := range squares {
10
        fmt.Println(s)
11
    }
12
}
13

14
func generate(nums ...int) <-chan int {
15
    out := make(chan int)
16
    go func() {
17
        defer close(out)
18
        for _, n := range nums {
19
            out <- n
20
        }
21
    }()
22
    return out
23
}
24

25
func square(in <-chan int) <-chan int {
26
    out := make(chan int)
27
    go func() {
28
        defer close(out)
29
        for n := range in {
30
            out <- n * n
31
        }
32
    }()
33
    return out
34
}

6.3 Scatter-Gather（分发-聚合）#

并行处理后合并结果：

graph TD Scatter["Scatter (分发任务)"] --> W1["Worker 1"] Scatter --> W2["Worker 2"] Scatter --> W3["Worker 3"] W1 --> Gather["Gather (聚合结果)"] W2 --> Gather W3 --> Gather

实现示例：

1
func scatterGather(inputs []Task, workers int) []Result {
2
    // Scatter: 分发任务
3
    tasks := make(chan Task, len(inputs))
4
    for _, input := range inputs {
5
        tasks <- input
6
    }
7
    close(tasks)
8

9
    // 启动 workers
10
    results := make(chan Result, workers)
11
    var wg sync.WaitGroup
12
    wg.Add(workers)
13

14
    for i := 0; i < workers; i++ {
15
        go func() {
16
            defer wg.Done()
17
            for task := range tasks {
18
                results <- process(task)
19
            }
20
        }()
21
    }
22

23
    // Gather: 等待所有 worker 完成
24
    go func() {
25
        wg.Wait()
26
        close(results)
27
    }()
28

29
    // 收集结果
30
    var allResults []Result
31
    for r := range results {
32
        allResults = append(allResults, r)
33
    }
34
    return allResults
35
}

6.4 Worker Pool（工作池）#

固定数量的 worker 处理任务：

graph TD Jobs["任务队列 [Job][Job][ ]"] --> W1["Worker 1"] Jobs --> W2["Worker 2"] Jobs --> W3["Worker 3"] W1 --> Results["结果队列"] W2 --> Results W3 --> Results

实现示例：

1
func workerPool(workers int, jobs <-chan Job, results chan<- Result) {
2
    var wg sync.WaitGroup
3
    wg.Add(workers)
4

5
    for i := 0; i < workers; i++ {
6
        go func(id int) {
7
            defer wg.Done()
8
            for job := range jobs {
9
                results <- process(job)
10
            }
11
        }(i)
12
    }
13

14
    wg.Wait()
15
    close(results)
16
}

6.5 Context 取消模式#

使用 context 实现超时和取消：

1
func worker(ctx context.Context, jobs <-chan Job) <-chan Result {
2
    out := make(chan Result)
3
    go func() {
4
        defer close(out)
5
        for {
6
            select {
7
            case <-ctx.Done():
8
                return // 取消
9
            case job, ok := <-jobs:
10
                if !ok {
11
                    return
12
                }
13
                select {
14
                case out <- process(job):
15
                case <-ctx.Done():
16
                    return
17
                }
18
            }
19
        }
20
    }()
21
    return out
22
}
23

24
// 使用示例
25
func main() {
26
    ctx, cancel := context.WithTimeout(context.Background(), 5*time.Second)
27
    defer cancel()
28

29
    jobs := make(chan Job, 10)
30
    results := worker(ctx, jobs)
31

32
    // ... 发送任务并处理结果
33
}

7. Channel 快速路径（Fast Path）#

7.1 非阻塞操作的快速路径#

Go runtime 对 channel 操作实现了快速路径（fast path）优化：在获取 hchan.lock 之前，先通过无锁的原子读取快速判断操作是否必然失败，从而避免加锁开销。

这段优化出现在 chansend 和 chanrecv 的开头：

1
// src/runtime/chan.go — https://github.com/golang/go/blob/go1.25.0/src/runtime/chan.go
2
func chansend(c *hchan, ep unsafe.Pointer, block bool, callerpc uintptr) bool {
3
    // ...
4

5
    // Fast path: check for failed non-blocking operation without acquiring the lock.
6
    //
7
    // After observing that the channel is not closed, we observe that the channel is
8
    // not ready for sending. Each of these observations is a single word-sized read
9
    // (first c.closed and second full()).
10
    // Because a closed channel cannot transition from 'ready for sending' to
11
    // 'not ready for sending', even if the channel is closed between the two observations,
12
    // they imply a moment between the two when the channel was both not yet closed
13
    // and not ready for sending.
14
    if !block && c.closed == 0 && full(c) {
15
        return false
16
    }
17
    // ...
18
}

chanrecv 中同样有对应的快速路径：

1
func chanrecv(c *hchan, ep unsafe.Pointer, block bool) (selected, received bool) {
2
    // ...
3

4
    // Fast path: check for failed non-blocking operation without acquiring the lock.
5
    if !block && empty(c) {
6
        // After observing that the channel is not ready for receiving, we observe whether
7
        // the channel is closed.
8
        if atomic.Load(&c.closed) == 0 {
9
            return
10
        }
11
        // The channel is irreversibly closed. Re-check whether the channel has any
12
        // pending data to receive, which could have arrived between the empty and
13
        // closed checks above.
14
        if empty(c) {
15
            if ep != nil {
16
                typedmemclr(c.elemtype, ep)
17
            }
18
            return true, false
19
        }
20
    }
21
    // ...
22
}

7.2 快速路径的工作原理#

快速路径的思想是：利用 channel 状态的单调性，通过两次无锁读取推断出某个时刻的真实状态。

flowchart TD A["非阻塞 send/recv"] --> B{"快速路径检查（无锁）"} B --> C["读取 c.closed"] C --> D{"c.closed != 0？"} D -- "是（已关闭）" --> E["走慢路径（加锁）"] D -- "否（未关闭）" --> F["读取 full()/empty()"] F --> G{"操作可以立即完成？"} G -- "是" --> H["走慢路径（加锁执行）"] G -- "否" --> I["直接返回 false 避免加锁"] style I fill:#4CAF50,color:#fff style E fill:#FF9800,color:#fff style H fill:#FF9800,color:#fff

推理过程：

发送快速路径：先读 c.closed（未关闭），再读 full(c)（满了）。因为已关闭的 channel 不会从「可发送」变为「不可发送」，所以即使两次读取之间 channel 被关闭，也必然存在一个时刻 channel 既未关闭又满了，此时发送必然失败，直接返回 false 是安全的。
接收快速路径：先读 empty(c)（空了），再读 c.closed（未关闭）。因为空且未关闭的 channel 不可能成功接收，直接返回。

full() 和 empty() 的实现也是无锁的：

1
// full 报告发送是否会阻塞（channel 是否满了）
2
func full(c *hchan) bool {
3
    if c.dataqsiz == 0 {
4
        // 无缓冲 channel：检查是否有等待接收者
5
        // 假定指针读取是 relaxed-atomic 的
6
        return c.recvq.first == nil
7
    }
8
    // 有缓冲 channel：检查 qcount
9
    // 假定 uint 读取是 relaxed-atomic 的
10
    return c.qcount == c.dataqsiz
11
}
12

13
// empty 报告接收是否会阻塞（channel 是否空了）
14
func empty(c *hchan) bool {
15
    if c.dataqsiz == 0 {
16
        return atomic.Loadp(unsafe.Pointer(&c.sendq.first)) == nil
17
    }
18
    if c.timer != nil {
19
        c.timer.maybeRunChan(c)
20
    }
21
    return atomic.Loaduint(&c.qcount) == 0
22
}

7.3 快速路径的适用场景#

快速路径仅对非阻塞操作生效，即 select 中的 case（编译为 selectnbsend/selectnbrecv）：

1
// select 中的非阻塞 send
2
func selectnbsend(c *hchan, elem unsafe.Pointer) (selected bool) {
3
    return chansend(c, elem, false, sys.GetCallerPC())
4
}

1
// select 中的非阻塞 recv
2
func selectnbrecv(elem unsafe.Pointer, c *hchan) (selected, received bool) {
3
    return chanrecv(c, elem, false)
4
}

场景	快速路径是否生效	原因
`select` + send	生效	`block=false`，可走快速路径
`select` + recv	生效	`block=false`，可走快速路径
普通 `ch <- x`	不生效	`block=true`，必须加锁
普通 `<-ch`	不生效	`block=true`，必须加锁

性能影响：在 select 中包含大量 case 时，快速路径可以显著减少锁竞争。每个 case 先做无锁检查，只有可能成功的 case 才会真正加锁，这降低了 selectgo 的开销。

8. reflect.Select：动态通道选择#

8.1 为什么需要 reflect.Select#

Go 的 select 语句要求 case 的数量在编译时确定。但在某些场景下，需要在运行时动态决定监听哪些 channel：

动态合并多个 channel：数量在运行时才确定
通用的多路复用器：如 fan-in 模式，输入 channel 数量可变
反射框架：需要在运行时构建 channel 操作

reflect.Select 正是为了解决这个需求：

1
// src/reflect/value.go — https://github.com/golang/go/blob/go1.25.0/src/reflect/value.go
2
func Select(cases []SelectCase) (chosen int, Value, ok bool)

8.2 SelectCase 结构#

1
type SelectCase struct {
2
    Dir  SelectDir // 方向：Send、Recv 或 Default
3
    Chan Value     // channel 值（Dir != Default 时使用）
4
    Send Value     // 发送值（Dir == Send 时使用）
5
}
6

7
type SelectDir int
8

9
const (
10
    SelectSend    SelectDir = iota // case Chan <- Send
11
    SelectRecv                     // case <-Chan:
12
    SelectDefault                  // default
13
)

8.3 使用示例：动态 fan-in#

1
package main
2

3
import (
4
    "fmt"
5
    "reflect"
6
    "time"
7
)
8

9
// dynamicFanIn 从任意数量的 channel 中接收数据
10
func dynamicFanIn(channels ...<-chan string) <-chan string {
11
    out := make(chan string)
12
    go func() {
13
        defer close(out)
14

15
        // 构建 SelectCase 切片
16
        cases := make([]reflect.SelectCase, len(channels))
17
        for i, ch := range channels {
18
            cases[i] = reflect.SelectCase{
19
                Dir:  reflect.SelectRecv,
20
                Chan: reflect.ValueOf(ch),
21
            }
22
        }
23

24
        // 持续接收，直到所有 channel 都关闭
25
        for len(cases) > 0 {
26
            chosen, value, ok := reflect.Select(cases)
27
            if !ok {
28
                // chosen channel 已关闭，从列表中移除
29
                cases = append(cases[:chosen], cases[chosen+1:]...)
30
                continue
31
            }
32
            out <- value.String()
33
        }
34
    }()
35
    return out
36
}
37

38
func main() {
39
    ch1 := make(chan string, 3)
40
    ch2 := make(chan string, 3)
41
    ch3 := make(chan string, 3)
42

43
    ch1 <- "from-ch1"
44
    ch2 <- "from-ch2"
45
    ch3 <- "from-ch3"
46
    close(ch1)
47
    close(ch2)
48
    close(ch3)
49

50
    merged := dynamicFanIn(ch1, ch2, ch3)
51
    for msg := range merged {
52
        fmt.Println(msg)
53
    }
54
}

8.4 reflect.Select 的实现原理#

reflect.Select 内部调用 runtime.selectgo，与编译器生成的 select 语句走相同的运行时路径：

flowchart TD A["reflect.Select(cases)"] --> B["验证 SelectCase 切片"] B --> C["构建 runtime.scase 数组"] C --> D["调用 runtime.selectgo()"] D --> E["selectgo 执行标准流程： 1. 洗牌 2. 轮询 3. 入队等待 4. 阻塞"] E --> F["返回 chosen, value, ok"] style D fill:#4d96ff,color:#fff

实现细节：

参数转换：reflect.Select 将 SelectCase 转换为 runtime.scase 结构，提取 hchan 指针和数据指针
公平性：与编译期 select 一样，selectgo 使用 Fisher-Yates 洗牌保证公平性
开销：相比编译期 select，reflect.Select 多了 SelectCase → scase 的转换开销和 reflect.Value 的装箱/拆箱开销

8.5 reflect.Select vs 编译期 select#

特性	编译期 `select`	`reflect.Select`
case 数量	编译时固定	运行时动态
类型安全	编译时检查	运行时检查
性能	最优	有额外反射开销
适用场景	已知 channel 集合	动态 channel 集合
公平性保证	Fisher-Yates 洗牌	Fisher-Yates 洗牌

最佳实践：如果 channel 数量在编译时已知，优先使用编译期 select；只有在确实需要动态选择时才使用 reflect.Select。

9. Channel 与 GC 的交互#

9.1 hchan 的 GC 扫描#

hchan 结构体中包含多个指针字段，GC 需要正确扫描它们以确保存活的 channel 数据不被回收：

1
type hchan struct {
2
    qcount   uint
3
    dataqsiz uint
4
    buf      unsafe.Pointer //  GC 需要扫描（指向缓冲区）
5
    elemsize uint16
6
    closed   uint32
7
    timer    *timer         //  GC 需要扫描
8
    elemtype *_type         //  GC 需要扫描（但实际是持久化数据，不需要 GC 跟踪）
9
    sendx    uint
10
    recvx    uint
11
    recvq    waitq          //  GC 需要扫描（包含 *sudog 指针）
12
    sendq    waitq          //  GC 需要扫描（包含 *sudog 指针）
13
    bubble   *synctestBubble
14
    lock     mutex
15
}

9.2 缓冲区的 GC 处理#

makechan 中对缓冲区的分配策略直接影响 GC 行为：

1
func makechan(t *chantype, size int) *hchan {
2
    // ...
3
    var c *hchan
4
    switch {
5
    case mem == 0:
6
        // 无缓冲 channel：只分配 hchan 本身
7
        c = (*hchan)(mallocgc(hchanSize, nil, true))
8

9
    case !elem.Pointers():
10
        // 元素不包含指针：hchan 和 buf 一次性分配
11
        // GC 不需要扫描 buf 中的元素
12
        c = (*hchan)(mallocgc(hchanSize+mem, nil, true))
13
        c.buf = add(unsafe.Pointer(c), hchanSize)
14

15
    default:
16
        // 元素包含指针：buf 单独分配
17
        // GC 需要扫描 buf 中的每个元素
18
        c = new(hchan)
19
        c.buf = mallocgc(mem, elem, true)
20
    }
21
    // ...
22
}

flowchart TD A["makechan(t, size)"] --> B{"元素包含指针？"} B -- "否（如 chan int）" --> C["hchan + buf 一次性分配 GC 不扫描 buf"] B -- "是（如 chan *int）" --> D["hchan 和 buf 分开分配 GC 扫描 buf 中的指针"] subgraph 无指针元素["chan int（无指针元素）"] direction LR HC1["hchan"] BUF1["buf [1][2][3][ ]"] HC1 ---|"同一次 mallocgc 内存相邻"| BUF1 end NOTE1["单次 mallocgc GC 扫描到 hchan 即可"] subgraph 有指针元素["chan *int（有指针元素）"] direction LR HC2["hchan"] BUF2["buf [*p1][*p2]"] HC2 -.->|"两次分配 hchan.buf 指向独立堆块"| BUF2 end NOTE2["两次分配 GC 需扫描 buf 中每个指针"] C --> HC1 HC1 --> NOTE1 D --> HC2 HC2 --> NOTE2 style C fill:#4CAF50,color:#fff style D fill:#FF9800,color:#fff

图中实线表示无指针场景下 hchan 与 buf 同属一次内存分配、地址相邻；虚线表示有指针场景下两者分开分配，hchan 通过 buf 字段指向另一块堆内存。

优化：当 channel 元素不包含指针时（如 chan int、chan float64 ），hchan 和缓冲区一次性分配，且 GC 不需要扫描缓冲区内容。这减少了 GC 的扫描工作量，也减少了堆上的对象数量。

9.3 sudog 与栈写屏障#

channel 操作中一个特殊的 GC 问题是：无缓冲 channel 的发送/接收会直接在两个 goroutine 的栈之间复制数据。

1
// sendDirect: src 在发送者栈上，dst 在接收者栈上
2
func sendDirect(t *_type, sg *sudog, src unsafe.Pointer) {
3
    dst := sg.elem
4
    typeBitsBulkBarrier(t, uintptr(dst), uintptr(src), t.Size_)
5
    memmove(dst, src, t.Size_)
6
}
7

8
// recvDirect: dst 在接收者栈/堆上，src 在发送者栈上
9
func recvDirect(t *_type, sg *sudog, dst unsafe.Pointer) {
10
    src := sg.elem
11
    typeBitsBulkBarrier(t, uintptr(dst), uintptr(src), t.Size_)
12
    memmove(dst, src, t.Size_)
13
}

这打破了 GC 的一个基本假设：栈上的写入只由该 goroutine 自己完成。为了正确处理这种情况，Go 使用了批量写屏障（typeBitsBulkBarrier）：

flowchart LR subgraph G1["G1（发送者）"] A["栈：值 x"] end subgraph G2["G2（接收者）"] B["栈：待填充"] end A -->|"sendDirect memmove + 写屏障"| B subgraph GC["GC 处理"] C["typeBitsBulkBarrier 确保 GC 看到跨栈指针"] end style GC fill:#FF9800,color:#fff

9.4 sudog 的 GC 可达性#

sudog 结构体代表一个在 channel 上等待的 goroutine。GC 通过以下路径确保 sudog 的可达性：

通过 goroutine 的 waiting 链：g.waiting 指向当前 goroutine 等待的 sudog 链表
通过 channel 的 sendq/recvq：hchan.sendq 和 hchan.recvq 包含等待的 sudog

Note

sudog.elem 指向的数据可能在 goroutine 的栈上，而不是堆上。栈扫描器（stack scanner）需要正确处理这种情况。当 goroutine 在 channel 上等待时，gp.activeStackChans 标志被设置为 true，告知栈收缩机制此时不能安全地缩小栈，因为其他 goroutine 可能正在通过 sudog.elem 写入该栈。

9.5 channel 与 GC 的性能影响#

场景	GC 影响
`chan int`（无指针元素）	缓冲区不扫描，GC 开销低
`chan *int`（有指针元素）	缓冲区每个元素都需扫描
大缓冲区 channel	增加 GC 扫描工作量，可能延长 STW 时间
大量阻塞的 sudog	增加可达性分析的工作量
无缓冲 channel + 跨栈复制	需要写屏障，但无额外堆分配

最佳实践：

优先使用不包含指针的元素类型（如 chan int 而非 chan *int），减少 GC 扫描
避免过大的缓冲区，大缓冲区会增加 GC 压力
及时关闭不再使用的 channel，让阻塞的 goroutine 得以释放

10. 性能考量与最佳实践#

10.1 channel 性能特性#

操作类型	时间复杂度	说明
发送/接收（无竞争）	O(1)	直接操作缓冲区或 sudog 队列
发送/接收（有锁竞争）	O(1)*	需要获取 hchan.lock
Select（n 个 case）	O(n)	需要遍历所有 case
关闭 channel	O(m+n)	m=发送者数量，n=接收者数量

10.2 最佳实践#

channel 的大小选择：
- 无缓冲：用于同步信号
- 有缓冲：用于解耦生产消费速率
- 避免”无限大”的缓冲：make(chan T, 1<<20) 可能导致内存问题
谁关闭 channel：
- 只有一个发送者：发送者关闭
- 多个发送者：使用额外信号或 sync.Once
- 永远不要在接收端关闭
避免 goroutine 泄漏：

1
// 错误：可能泄漏
2
func bad() {
3
    ch := make(chan int)
4
    go func() {
5
        ch <- 42 // 如果没有人接收，永远阻塞
6
    }()
7
    // 没有<-ch
8
}

1
// 正确：使用 context 或 done channel
2
func good(ctx context.Context) {
3
    ch := make(chan int, 1)
4
    go func() {
5
        select {
6
        case ch <- 42:
7
        case <-ctx.Done():
8
        }
9
    }()
10
}

nil channel 的妙用：

1
// nil channel 在 select 中会被忽略
2
var ch1, ch2 chan int
3

4
select {
5
case v := <-ch1: // ch1 为 nil，不会执行
6
    fmt.Println(v)
7
case v := <-ch2: // ch2 为 nil，不会执行
8
    fmt.Println(v)
9
}
10

11
// 动态启用/禁用 case
12
var sendCh chan<- int
13
if shouldSend {
14
    sendCh = actualChannel // 非 nil 才会参与 select
15
}

11. 总结#

Go 的并发模型建立在 CSP 理论之上，通过 goroutine 和 channel 提供了简洁的并发编程能力：

概念	要点
goroutine	轻量级、2KB 初始栈、由 Go runtime 调度
channel	hchan 结构、环形缓冲区、sudog 等待队列、互斥锁保护
select	随机公平、多路复用、支持 default 非阻塞
并发模式	fan-out、pipeline、scatter-gather、worker pool

理解这些底层原理，有三个直接影响日常开发的结论：channel 的锁竞争在高并发场景下是瓶颈，select 的随机公平性意味着每次 case 评估都有调度开销，sudog 等待队列在大量 goroutine 竞争时退化为链表遍历；无缓冲 channel 的同步语义在调试时是利器（发送和接收必然配对），但在线上是性能杀手（每次通信都引入一次调度点）；关闭已关闭的 channel 会 panic，这是 Go 并发编程中最常见的运行时错误之一，根因是 channel 关闭状态不可逆，重复关闭无法区分”已关闭”和”正在关闭”。

参考资料#

Go Channel Implementation - Go 官方 runtime 中 channel 的完整实现，hchan、chansend、chanrecv 源码
Communicating Sequential Processes (CSP) - Tony Hoare 1978 年论文，Go 并发模型的理论源头
Go Concurrency Patterns - Go 官方博客，pipeline、fan-out、fan-in 等并发模式的典型写法
Effective Go - Channels - Go 官方入门文档，channel 的基本语义和常见用法
Go Runtime Source Code - Go runtime 源码目录，proc.go、chan.go、select.go 的合集入口

1. CSP 模型：Go 并发的理论基础#

1.1 什么是 CSP？#

1.2 传统并发模型 vs CSP 模型#

2. Goroutine：轻量级并发单元#

2.1 goroutine 的创建：newproc#

2.2 goroutine 的状态转换#

2.3 goroutine 的销毁#

3. Channel：goroutine 之间的通信管道#

Channel 通信架构#

Channel 通信模式#

3.1 hchan：channel 的底层数据结构#

channel 的 FIFO 语义与历史演进#

为什么 channel 是”有锁”而非”无锁”？#

3.2 channel 创建#

3.3 channel 发送原理#

3.4 channel 接收原理#

3.6 channel 关闭#

4. Select：多路复用#

4.1 select 的实现原理#

4.2 scase 结构#

4.3 selectgo 逻辑#

4.4 select 流程图#

5. 通道方向与类型安全#

5.1 单向通道#

5.2 类型安全的好处#

6. 常见并发模式#

6.1 Fan-Out（扇出）#

6.2 Pipeline（管道）#

6.3 Scatter-Gather（分发-聚合）#

6.4 Worker Pool（工作池）#

6.5 Context 取消模式#

7. Channel 快速路径（Fast Path）#

7.1 非阻塞操作的快速路径#

7.2 快速路径的工作原理#

7.3 快速路径的适用场景#

8. reflect.Select：动态通道选择#

8.1 为什么需要 reflect.Select#

8.2 SelectCase 结构#

8.3 使用示例：动态 fan-in#

8.4 reflect.Select 的实现原理#

8.5 reflect.Select vs 编译期 select#

9. Channel 与 GC 的交互#

9.1 hchan 的 GC 扫描#

9.2 缓冲区的 GC 处理#

9.3 sudog 与栈写屏障#

9.4 sudog 的 GC 可达性#

9.5 channel 与 GC 的性能影响#

10. 性能考量与最佳实践#

10.1 channel 性能特性#

10.2 最佳实践#

11. 总结#

参考资料#

支持与分享