什么是工作窃取（Work Stealing）机制

面试官：什么是工作窃取（Work Stealing）机制？

面试回答

“工作窃取（Work Stealing）是 Go 语言 GMP 调度模型中用来保证负载均衡和最大化 CPU 利用率的核心机制。

在 GMP 模型里，每个逻辑处理器 P 都有自己的一个本地队列，用来存放等待运行的 Goroutine (G)。绑定的 M 会不断从这个本地队列里取 G 来执行。但是，不同的 P 处理任务的速度可能不一样，有的 P 很快就把自己队列里的 G 执行完了，而有的 P 队列里还堆积着很多 G。

这时候，为了不让闲下来的 M 白白浪费 CPU 资源，Go 的调度器就允许这个空闲的 P 去‘偷’别人的工作。具体来说，它会随机挑选另一个 P，然后把那个 P 本地队列里一半的 G 偷过来，放到自己的本地队列里继续执行。

如果所有的 P 都没有多余的 G 可以偷，它还会去全局队列里找，或者去网络轮询器（Netpoller）里看看有没有就绪的 G。通过这种‘互帮互助’的窃取机制，Go 能够非常高效地把并发任务动态地分配到各个 CPU 核心上，避免了全局锁的竞争，极大地提升了并发性能。”

在 Go 语言的调度器中，为了减少全局锁的竞争，每个 P（Processor）都维护了一个本地的可运行 G 队列（最多 256 个）。M（Machine）绑定 P 后，优先从本地队列获取 G 执行。

然而，这种局部队列的设计会带来负载不均衡的问题：某些 P 的任务可能很快执行完毕，而其他 P 依然不堪重负。Work Stealing 机制正是为了解决这一问题而诞生的。

当一个 P 的本地队列为空，且全局队列也为空时，M 会尝试进行 Work Stealing。整个寻找 G 的过程（findrunnable 函数）大致如下：

本地队列：首先检查 P 自己的本地队列是否有 G。
全局队列：如果本地队列为空，每 61 次调度会优先检查一次全局队列，防止全局队列中的 G 饿死。
网络轮询器 (Netpoller)：检查是否有非阻塞的就绪网络 I/O 任务。
工作窃取 (Work Stealing)：
- 调度器会随机挑选一个其他的 P。
- 尝试从该 P 的本地队列尾部（队尾）窃取一半的 G。
- 窃取一半的设计是为了在“减少窃取次数”和“保持负载均衡”之间取得平衡。
休眠：如果经过多次尝试（通常是遍历所有 P 并尝试窃取 4 次）仍然没有找到可运行的 G，M 会解除与 P 的绑定，将 P 放入空闲列表，M 自身进入休眠状态（StopM）。

每次窃取一半的 G 是一种启发式算法的权衡：

为了保证 Work Stealing 的高效性，P 的本地队列被设计为一个无锁的环形数组。

拥有者 P：只有绑定该 P 的 M 才能从队列头部（Head）弹出 G，这部分操作是无锁的（单生产者单消费者模型）。
窃取者：其他尝试窃取的 M 会从队列尾部（Tail）批量抓取 G。
并发控制：头部和尾部的并发访问通过底层的**原子操作（Atomic Operations）**和内存屏障来保证一致性，从而完全避免了使用重量级的互斥锁（Mutex），极大地降低了调度的延迟。