Go的調(diào)度的實現(xiàn),涉及到幾個重要的數(shù)據(jù)結(jié)構(gòu)。運行時庫用這幾個數(shù)據(jù)結(jié)構(gòu)來實現(xiàn)goroutine的調(diào)度,管理goroutine和物理線程的運行。這些數(shù)據(jù)結(jié)構(gòu)分別是結(jié)構(gòu)體G,結(jié)構(gòu)體M,結(jié)構(gòu)體P,以及Sched結(jié)構(gòu)體。前三個的定義在文件runtime/runtime.h中,而Sched的定義在runtime/proc.c中。Go語言的調(diào)度相關(guān)實現(xiàn)也是在文件proc.c中。
G是goroutine的縮寫,相當(dāng)于操作系統(tǒng)中的進(jìn)程控制塊,在這里就是goroutine的控制結(jié)構(gòu),是對goroutine的抽象。其中包括goid是這個goroutine的ID,status是這個goroutine的狀態(tài),如Gidle,Grunnable,Grunning,Gsyscall,Gwaiting,Gdead等。
struct G
{
uintptr stackguard; // 分段棧的可用空間下界
uintptr stackbase; // 分段棧的?;? Gobuf sched; //進(jìn)程切換時,利用sched域來保存上下文
uintptr stack0;
FuncVal* fnstart; // goroutine運行的函數(shù)
void* param; // 用于傳遞參數(shù),睡眠時其它goroutine設(shè)置param,喚醒時此goroutine可以獲取
int16 status; // 狀態(tài)Gidle,Grunnable,Grunning,Gsyscall,Gwaiting,Gdead
int64 goid; // goroutine的id號
G* schedlink;
M* m; // for debuggers, but offset not hard-coded
M* lockedm; // G被鎖定只能在這個m上運行
uintptr gopc; // 創(chuàng)建這個goroutine的go表達(dá)式的pc
...
};
結(jié)構(gòu)體G中的部分域如上所示。可以看到,其中包含了棧信息stackbase和stackguard,有運行的函數(shù)信息fnstart。這些就足夠成為一個可執(zhí)行的單元了,只要得到CPU就可以運行。
goroutine切換時,上下文信息保存在結(jié)構(gòu)體的sched域中。goroutine是輕量級的線程
或者稱為協(xié)程
,切換時并不必陷入到操作系統(tǒng)內(nèi)核中,所以保存過程很輕量??匆幌陆Y(jié)構(gòu)體G中的Gobuf,其實只保存了當(dāng)前棧指針,程序計數(shù)器,以及goroutine自身。
struct Gobuf
{
// The offsets of these fields are known to (hard-coded in) libmach.
uintptr sp;
byte* pc;
G* g;
...
};
記錄g是為了恢復(fù)當(dāng)前goroutine的結(jié)構(gòu)體G指針,運行時庫中使用了一個常駐的寄存器extern register G* g
,這個是當(dāng)前goroutine的結(jié)構(gòu)體G的指針。這樣做是為了快速地訪問goroutine中的信息,比如,Go的棧的實現(xiàn)并沒有使用%ebp寄存器,不過這可以通過g->stackbase快速得到。"extern register"是由6c,8c等實現(xiàn)的一個特殊的存儲。在ARM上它是實際的寄存器;其它平臺是由段寄存器進(jìn)行索引的線程本地存儲的一個槽位。在linux系統(tǒng)中,對g和m使用的分別是0(GS)和4(GS)。需要注意的是,鏈接器還會根據(jù)特定操作系統(tǒng)改變編譯器的輸出,例如,6l/linux下會將0(GS)重寫為-16(FS)。每個鏈接到Go程序的C文件都必須包含runtime.h頭文件,這樣C編譯器知道避免使用專用的寄存器。
M是machine的縮寫,是對機(jī)器的抽象,每個m都是對應(yīng)到一條操作系統(tǒng)的物理線程。M必須關(guān)聯(lián)了P才可以執(zhí)行Go代碼,但是當(dāng)它處理阻塞或者系統(tǒng)調(diào)用中時,可以不需要關(guān)聯(lián)P。
struct M
{
G* g0; // 帶有調(diào)度棧的goroutine
G* gsignal; // signal-handling G 處理信號的goroutine
void (*mstartfn)(void);
G* curg; // M中當(dāng)前運行的goroutine
P* p; // 關(guān)聯(lián)P以執(zhí)行Go代碼 (如果沒有執(zhí)行Go代碼則P為nil)
P* nextp;
int32 id;
int32 mallocing; //狀態(tài)
int32 throwing;
int32 gcing;
int32 locks;
int32 helpgc; //不為0表示此m在做幫忙gc。helpgc等于n只是一個編號
bool blockingsyscall;
bool spinning;
Note park;
M* alllink; // 這個域用于鏈接allm
M* schedlink;
MCache *mcache;
G* lockedg;
M* nextwaitm; // next M waiting for lock
GCStats gcstats;
...
};
這里也是截取結(jié)構(gòu)體M中的部分域。和G類似,M中也有alllink域?qū)⑺械腗放在allm鏈表中。lockedg是某些情況下,G鎖定在這個M中運行而不會切換到其它M中去。M中還有一個MCache,是當(dāng)前M的內(nèi)存的緩存。M也和G一樣有一個常駐寄存器變量,代表當(dāng)前的M。同時存在多個M,表示同時存在多個物理線程。
結(jié)構(gòu)體M中有兩個G是需要關(guān)注一下的,一個是curg,代表結(jié)構(gòu)體M當(dāng)前綁定的結(jié)構(gòu)體G。另一個是g0,是帶有調(diào)度棧的goroutine,這是一個比較特殊的goroutine。普通的goroutine的棧是在堆上分配的可增長的棧,而g0的棧是M對應(yīng)的線程的棧。所有調(diào)度相關(guān)的代碼,會先切換到該goroutine的棧中再執(zhí)行。
Go1.1中新加入的一個數(shù)據(jù)結(jié)構(gòu),它是Processor的縮寫。結(jié)構(gòu)體P的加入是為了提高Go程序的并發(fā)度,實現(xiàn)更好的調(diào)度。M代表OS線程。P代表Go代碼執(zhí)行時需要的資源。當(dāng)M執(zhí)行Go代碼時,它需要關(guān)聯(lián)一個P,當(dāng)M為idle或者在系統(tǒng)調(diào)用中時,它也需要P。有剛好GOMAXPROCS個P。所有的P被組織為一個數(shù)組,在P上實現(xiàn)了工作流竊取的調(diào)度器。
struct P
{
Lock;
uint32 status; // Pidle或Prunning等
P* link;
uint32 schedtick; // 每次調(diào)度時將它加一
M* m; // 鏈接到它關(guān)聯(lián)的M (nil if idle)
MCache* mcache;
G* runq[256];
int32 runqhead;
int32 runqtail;
// Available G's (status == Gdead)
G* gfree;
int32 gfreecnt;
byte pad[64];
};
結(jié)構(gòu)體P中也有相應(yīng)的狀態(tài):
Pidle,
Prunning,
Psyscall,
Pgcstop,
Pdead,
注意,跟G不同的是,P不存在waiting
狀態(tài)。MCache被移到了P中,但是在結(jié)構(gòu)體M中也還保留著。在P中有一個Grunnable的goroutine隊列,這是一個P的局部隊列。當(dāng)P執(zhí)行Go代碼時,它會優(yōu)先從自己的這個局部隊列中取,這時可以不用加鎖,提高了并發(fā)度。如果發(fā)現(xiàn)這個隊列空了,則去其它P的隊列中拿一半過來,這樣實現(xiàn)工作流竊取的調(diào)度。這種情況下是需要給調(diào)用器加鎖的。
Sched是調(diào)度實現(xiàn)中使用的數(shù)據(jù)結(jié)構(gòu),該結(jié)構(gòu)體的定義在文件proc.c中。
struct Sched {
Lock;
uint64 goidgen;
M* midle; // idle m's waiting for work
int32 nmidle; // number of idle m's waiting for work
int32 nmidlelocked; // number of locked m's waiting for work
int3 mcount; // number of m's that have been created
int32 maxmcount; // maximum number of m's allowed (or die)
P* pidle; // idle P's
uint32 npidle; //idle P的數(shù)量
uint32 nmspinning;
// Global runnable queue.
G* runqhead;
G* runqtail;
int32 runqsize;
// Global cache of dead G's.
Lock gflock;
G* gfree;
int32 stopwait;
Note stopnote;
uint32 sysmonwait;
Note sysmonnote;
uint64 lastpoll;
int32 profilehz; // cpu profiling rate
}
大多數(shù)需要的信息都已放在了結(jié)構(gòu)體M、G和P中,Sched結(jié)構(gòu)體只是一個殼??梢钥吹?,其中有M的idle隊列,P的idle隊列,以及一個全局的就緒的G隊列。Sched結(jié)構(gòu)體中的Lock是非常必須的,如果M或P等做一些非局部的操作,它們一般需要先鎖住調(diào)度器。
更多建議: