Golang随谈——浅瞰底层：Go的并发调度模型

国内喜欢把Go的并发模型称为G-M-P模型，但在网上一查，貌似国外并没有这样的定义，他们喜欢直接称其为Go Scheduler——Go的调度器。不管如何，G-M-P都是Go调度器中的重要概念，它们都定义在sys/runtime/runtime2.go文件中，让我们看看它们都代表什么吧：

G for Goroutine，定义于struct g，其存放着Goroutine的状态信息，如保存着Goroutine的执行堆栈信息、Goroutine的等待信息和变量的GC信息等信息。我们每用关键字go创建一个Goroutine，其在go程序的底层都创建了一个对应的G对象。
M for Machine，定义于struct m，对应着操作系统的工作线程，其和物理处理器线程对应，它负责任务的调度，是实际驱动G运行的实体，但M不负责G的状态的管理，需要切换执行的G时，M会把G的堆栈状态写回到G。实际上，在Go1.1之前，Go只有G-M模型，此前还没有P这个概念，直到Dmitry Vyukov在2012年发表了《Scalable Go Scheduler Design Doc》文章，改文章指出当时G-M模型的问题——用全局唯一的锁和中心化的状态来保护Goroutine相关的操作，Goroutine之间的切换可能会过载，每个M之间的内存缓存问题，以及抢占式线程的阻塞和非阻塞增加了很多开销。因此提出引入Processors的概念到runtime中。
P for Processor，定义于struct p，实现了逻辑上的处理器，它的责任是负责提供相关的上下文环境，负责内存缓存的管理，负责Goroutine任务队列等。P是G和M的中间层，M会和P先绑定，然后M会不断地从P的任务队列中取出G并恢复执行（取出操作无锁，因为没有资源竞争的问题），当P的任务队列都处理完，P再从全局队列中返回一个G来执行（取出操作有锁，因为这可能会和其它的P竞争），当全局队列也没有G时，则从其它的P窃取G来执行。当再也没有G可以被执行时，M和P会被解绑，进入休眠状态。P的个数默认为物理线程数。

Go的调度器才是概念的重点，而G-M-P则是Go调度器组成的重要部分。P和M通常是对应的，简单来说，P管理着一组G，并负责把G挂载到M上运行。当一个M长时间在运行同一个M时，runtime会创建一个新的M，阻塞的G所在的P会把其余的G挂载到新的M上，当这个阻塞的G阻塞完成或者结束时，该旧M会被回收。

关于G的运行，因为M在运行G的过程中，会遇到需要上下文切换的情况——当一个被运行的G要被切换时，需要对G的执行现场进行保护，以便下次被调度执行时进行现场恢复，Go调度器的做法是，把M的堆栈和M所需的寄存器（SP、PC等）保存到G中，就可以实现现场保护了。当调度器再次运行该G的时候，M通过访问G中保存的寄存器进行现场恢复，即可从上次中断的位置继续执行。

Go这种调度器使用了m:n调度的技术，即复用或调度m个goroutine到n个OS线程。其中m的调度由Go程序的运行时负责，n的调度由OS负责。这让m的调度可以在用户态下完成，不会造成内核态和用户态见的频繁切换。同时，内存的分配和释放，文件的IO等，Go也通过内存池和netpoll等技术，尽量减少内核态的调用。

G的状态

Goroutine在生命周期的不断的阶段，会有不同的G状态。而通过分析G的状态，有助于我们了解Goroutine的调度。在runtime2.go文件中定义了，G有以下几种状态——idle, runnable, running, syscall, waiting, dead, copystack六种非GC状态，以及scan, scanrunnable, scan running, scansyscall, scanwaiting六种对应的GC状态，而moribund_unused和enqueue_unused两种状态已经被废弃了：

_Gidle for idle，意思是这个goroutine刚被创建出来，还未被进行初始化。因为它的值为0，所以刚被创建出来的g对象都是_Gidle。但在runtime库仅有的两处调用中，创建出来的g都马上被赋值为_Gdead，这是为了g在添加到被GC观察之前，用于躲避trackbacks和stack scan，因为这个g对象在必要的处理前，还不是一个真正的goroutine。
_Grunnable for runnable，意思是这个goroutine已经在运行队列，在这种情况下，goroutine还未执行用户代码，M的执行栈还不是goroutine自己的。
_Grunning for running，意思是goroutine可能正在执行用户代码，M的执行栈已经由该goroutine所拥有，此时对象g不在运行队列中。这个状态值要待分配给M和P之后，交由M和P来设定。
_Gsyscall for system scall，意思是这个goroutine正在执行系统调用，而不是正在执行用户代码。和_Grunning一样，goroutine拥有了执行栈，也不在运行队列中。这个状态值只能由分配给的M来设定。
_Gwaiting for waiting，意思是goroutine在运行时被阻塞，它既不执行用户代码，也不在运行队列。它被记录在其它的地方，例如管道等待队列——channel wait queue，因此当需要该goroutine的时候，该goroutine可以马上就绪，这也是goroutine和channel的底层实现方式。这个时候，执行栈不被该g对象所拥有，除非一个管道正在做读或者写执行栈里面数据的操作。除了以上这类型的情况，在一个goroutine进入_Gwaiting之后尝试获取其执行栈，都是不安全的。
_Gdead for dead，意思是这个goroutine在当前不被使用，这种情况可能是goroutine刚被创建出来，或者已经执行完毕退出并被放到释放列表中。当一个G执行完毕并正在退出时，和G被添加到释放列表时，G和G的执行栈都是M所拥有的。
_Gcopystack for copy stack，意思是这个goroutine的执行栈已经被移动，这个goroutine即不执行用户代码，也不在运行队列。这种状态是_Grunning的时候，出现了执行栈空间不足或者过大，需要扩容或者GC的情况下发生，是进行执行栈扩容或者收缩时的中间状态。
_Gscan系列，用于标记正在被GC扫描的状态，这些状态是由_Gscan=0x1000再加上_GRunnable, _Grunning, _Gsyscall和_Gwaiting的枚举值所产生的，这么做的好处是直接通过简单的运算即可知道被Scan之前的状态。当被标记为这系列的状态时，这些goroutine都不会执行用户代码，并且它们的执行栈都是被做该GC的goroutine所拥有。不过_Gscanrunning状态有点特别，这个标记是为了阻止正在运行的goroutine切换成其它状态，并告诉这个G自己扫描自己的堆栈。正是这种巧妙的方式，使得Go语言的GC十分高效。

从以上列举的状态可以分析出，无论是处理waiting的业务，还是处理GC，goroutine是高效的。但当要调用system call的时候则不然，低效的系统调用业务代码，会影响Go应用的运行性能，幸好Go语言中已经封装了很多能代替用户低效的系统调用的工具，例如网络调用看似是系统调用，但Go实际上已经在底层封装了netpoll，我们应该尽量使用这些库来避免系统调用。不合理的设计导致频繁copy stack和会导致频繁GC的设计等设计，这些都是我们需要注意的。

2020.02

tou.hwang

G的状态

Recommend

CSS 故障艺术

全！GitHub 总星 5.7w+，超赞的操作系统软件都在这里啦！

PingCAP CTO 黄东旭：远程办公 5 年，分布式解决所有问题

武汉战“疫”17天：6000网约车司机穿越生死线

疫情之下消费产业自救：员工可共享文体转线上

百万销量咋办？廉价版iPhone发布或受疫情影响推迟

牛津大学流行病学教授:武汉疫情扑朔迷离，何时终了

亚马逊因疫情退出巴塞罗那世界移动通信大会

关于网上各种GO语言GC文章的一些困惑和个人理解

如何在 Vue 中使用 JSX 以及使用它的原因

About Joyk