App下載

從小白到高手,你需要理解同步與異步(內含10張圖)

猿友 2020-10-15 18:38:36 瀏覽數(shù) (5933)
反饋

在這篇文章中我們來討論一下到底什么是同步,什么是異步,以及在編程中這兩個極為重要的概念到底意味著什么。

相信很多同學遇到同步異步這兩個詞的時候大腦瞬間就像紅綠燈失靈的十字路口一樣陷入一片懵逼的狀態(tài):

是的,這兩個看上去很像實際上也很像的詞匯給博主造成過很大的困擾,這兩個詞背后所代表的含義到底是什么呢?

我們先從工作場景講起。

苦逼程序員

假設現(xiàn)在老板分配給了你一個很緊急并且很重要的任務,讓你下班前必須完成(萬惡的資本主義)。為了督促進度,老板搬了個椅子坐在一邊盯著你寫代碼。

你心里肯定已經罵上了,“WTF,你有這么閑嗎?盯著老子,你就不能去干點其他事情嗎?”

老板仿佛接收到了你的腦電波一樣:“我就在這等著,你寫完前我哪也不去,廁所也不去?!?/p>

這個例子中老板交給你任務后就一直等待,什么都不做直到你寫完,這個場景就是所謂的同步。

第二天,老板又交給了你一項任務。

不過這次就沒那么著急啦,這次老板輕描淡寫,“小伙子可以啊,不錯不錯,你再努力干一年,明年我就財務自由了,今天的這個任務不著急,你寫完告訴我一聲就行”。

這次老板沒有盯著你寫代碼,而是轉身刷視頻去了,你寫完后簡單的和老板報告一聲“我寫完了”。

在這個例子中老板交代完任務后不再一直等著什么都不做而是就去忙其它事情,你完成任務后簡單的告訴老板任務完成,這就是所謂的異步。

值得注意的是,在異步這種場景下重點是在你寫代碼的同時老板在刷劇,這兩件事在同時進行,而不是一方等待另一方,因此這就是為什么一般來說異步比同步高效的本質所在,不管同步異步應用在什么場景下。

我們可以看到同步這個詞往往和任務的“依賴”、“關聯(lián)”、“等待”等關鍵詞相關,而異步往往和任務的“不依賴”,“無關聯(lián)”,“無需等待”,“同時發(fā)生”等關鍵詞相關。

By the way,如果遇到一個在身后盯著你寫代碼的老板,三十六計走為上策。

打電話與發(fā)郵件

作為一名苦逼的程序員是不能只顧埋頭搬磚的,平時工作中的溝通免除不了,其中一種高效的溝通方式是吵架。。。啊不,是電話。

通常打電話時都是一個人在說另一個人聽,一個人在說的時候另一個人等待,等另一個人說完后再接著說,因此在這個場景中你可以看到,“依賴”、“關聯(lián)”、“等待”這些關鍵詞出現(xiàn)了,因此打電話這種溝通方式就是所謂的同步。

另一種碼農常用的溝通方式是郵件。

郵件是另一種必不可少溝通方式,因為沒有人傻等著你寫郵件什么都不做,因此你可以慢慢悠悠的寫,當你在寫郵件時收件人可以去做一些像摸摸魚啊、上個廁所、和同時抱怨一下為什么十一假期不放兩周之類有意義的事情。

同時當你寫完郵件發(fā)出去后也不需要干巴巴的等著對方回復什么都不做,你也可以做一些像摸魚之類這樣有意義的事情。

在這里,你寫郵件別人摸魚,這兩件事又在同時進行,收件人和發(fā)件人都不需要相互等待,發(fā)件人寫完郵件的時候簡單的點個發(fā)送就可以了,收件人收到后就可以閱讀啦,收件人和發(fā)件人不需要相互依賴、不需要相互等待。

你看,在這個場景下“不依賴”,“無關聯(lián)”,“無需等待”這些關鍵詞就出現(xiàn)了,因此郵件這種溝通方式就是異步的。

同步調用

現(xiàn)在終于回到編程的主題啦。

既然現(xiàn)在我們已經理解了同步與異步在各種場景下的意義(I hope so),那么對于程序員來說該怎樣理解同步與異步呢?

我們先說同步調用,這是程序員最熟悉的場景。

一般的函數(shù)調用都是同步的,就像這樣:

funcA() {
    // 等待函數(shù)funcB執(zhí)行完成
    funcB();
    // 繼續(xù)接下來的流程
}

funcA 調用 funcB,那么在 funcB 執(zhí)行完前,funcA 中的后續(xù)代碼都不會被執(zhí)行,也就是說 funcA 必須等待 funcB 執(zhí)行完成,就像這樣:

從上圖中我們可以看到,在funcB運行期間funcA什么都做不了,這就是典型的同步。

注意,一般來說,像這種同步調用,funcAfuncB是運行在同一個線程中的,這是最為常見的情況。

但值得注意的是,即使運行在兩個不能線程中的函數(shù)也可以進行同步調用,像我們進行 IO 操作時實際上底層是通過系統(tǒng)調用的方式向操作系統(tǒng)發(fā)出請求的,比如磁盤文件讀取:

read(file, buf);

這就是阻塞式 I/O,在read函數(shù)返回前程序是無法繼續(xù)向前推進的

read(file, buf);
// 程序暫停運行,
// 等待文件讀取完成后繼續(xù)運行

如圖所示:

只有當read函數(shù)返回后程序才可以被繼續(xù)執(zhí)行。

注意,和上面的同步調用不同的是,函數(shù)和被調函數(shù)運行在不同的線程中。

因此我們可以得出結論,同步調用和函數(shù)與被調函數(shù)是否運行在同一個線程是沒有關系的。

在這里我們還要再次強調,同步方式下函數(shù)和被調函數(shù)無法同時進行。

同步編程對程序員來說是最自然最容易理解的。

但容易理解的代價就是在一些場景下,同步并不是高效的,原因很簡單,因為任務沒有辦法同時進行。

接下來我們看異步調用。

異步調用

有同步調用就有異步調用。

如果你真的理解了本節(jié)到目前為止的內容的話,那么異步調用對你來說不是問題。

一般來說,異步調用總是和 I/O 操作等耗時較高的任務如影隨形,像磁盤文件讀寫、網(wǎng)絡數(shù)據(jù)的收發(fā)、數(shù)據(jù)庫操作等。

我們還是以磁盤文件讀取為例。

read函數(shù)的同步調用方式下,文件讀取完之前調用方是無法繼續(xù)向前推進的,但如果read函數(shù)可以異步調用情況就不一樣了。

假如read函數(shù)可以異步調用的話,即使文件還沒有讀取完成,read函數(shù)也可以立即返回。

read(file, buff);
// read函數(shù)立即返回
// 不會阻塞當前程序

就像這樣:

可以看到,在異步這種調用方式下,調用方不會被阻塞,函數(shù)調用完成后可以立即執(zhí)行接下來的程序。

這時異步的重點就在于調用方接下來的程序執(zhí)行可以和文件讀取同時進行,從上圖中我們也能看出這一點,這就是異步的高效之處。

但是,請注意,異步調用對于程序員來說在理解上是一種負擔,代碼編寫上更是一種負擔,總的來說,上帝在為你打開一扇門的時候會適當?shù)年P上一扇窗戶。

有的同學可能會問,在同步調用下,調用方不再繼續(xù)執(zhí)行而是暫停等待,被調函數(shù)執(zhí)行完后很自然的就是調用方繼續(xù)執(zhí)行,那么異步調用下調用方怎知道被調函數(shù)是否執(zhí)行完成呢?

這就分為了兩種情況:

  1. 調用方根本就不關心執(zhí)行結果
  2. 調用方需要知道執(zhí)行結果

第一種情況比較簡單,無需討論。

第二種情況下就比較有趣了,通常有兩種實現(xiàn)方式:

一種是通知機制,也就是說當任務執(zhí)行完成后發(fā)送信號來通知調用方任務完成,注意這里的信號有很多實現(xiàn)方式,Linux 中的signal,或者使用信號量等機制都可以實現(xiàn)。

另一種是就是回調,也就是我們常說的callback,關于回調我們將在下一篇文章中重點講解,本篇會有簡短的討論。

接下來我們用一個具體的例子講解一下同步調用與異步調用。

同步 VS 異步

我們以常見的 Web 服務來舉例說明這一問題。

一般來說 Web Server 接收到用戶請求后會有一些典型的處理邏輯,最常見的就是數(shù)據(jù)庫查詢(當然,你也可以把這里的數(shù)據(jù)庫查詢換成其它 I/O 操作,比如磁盤讀取、網(wǎng)絡通信等),在這里我們假定處理一次用戶請求需要經過步驟 A、B、C,然后讀取數(shù)據(jù)庫,數(shù)據(jù)庫讀取完成后需要經過步驟 D、E、F,就像這樣:

# 處理一次用戶請求需要經過的步驟:
A;
B;
C;
數(shù)據(jù)庫讀取;
D;
E;
F;

其中步驟 A、B、C 和 D、E、F 不需要任何 I/O ,也就是說這六個步驟不需要讀取文件、網(wǎng)絡通信等,涉及到 I/O 操作的只有數(shù)據(jù)庫查詢這一步。

一般來說這樣的 Web Server 有兩個典型的線程:主線程和數(shù)據(jù)庫處理線程,注意,這討論的只是典型的場景,具體業(yè)務實際上可會有差別,但這并不影響我們用兩個線程來說明問題。

首先我們來看下最簡單的實現(xiàn)方式,也就是同步。

這種方式最為自然也最為容易理解:

// 主線程
main_thread() {
    A;
    B;    
    C;    
    發(fā)送數(shù)據(jù)庫查詢請求;
    D;
    E;
    F;
    }
// 數(shù)據(jù)庫線程
DataBase_thread() {
    while(1) {
        處理數(shù)據(jù)庫讀取請求;
        返回結果;
    }
}

這就是最為典型的同步方法,主線程在發(fā)出數(shù)據(jù)庫查詢請求后就會被阻塞而暫停運行,直到數(shù)據(jù)庫查詢完畢后面的 D、E、F 才可以繼續(xù)運行,就像這樣:

從圖中我們可以看到,主線程中會有“空隙”,這個空隙就是主線程的“休閑時光”,主線程在這段休閑時光中需要等待數(shù)據(jù)庫查詢完成才能繼續(xù)后續(xù)處理流程。

在這里主線程就好比監(jiān)工的老板,數(shù)據(jù)庫線程就好比苦逼搬磚的程序員,在搬完磚前老板什么都不做只是緊緊的盯著你,等你搬完磚后才去忙其它事情。

顯然,高效的程序員是不能容忍主線程偷懶的。

是時候祭出大殺器了,這就是異步。

在異步這種實現(xiàn)方案下主線程根本不去等待數(shù)據(jù)庫是否查詢完成,而是發(fā)送完數(shù)據(jù)庫讀寫請求后直接處理下一個請求。

有的同學可能會有疑問,一個請求需要經過 A、B、C、數(shù)據(jù)庫查詢、D、E、F 這七個步驟,如果主線程在完成 A、B、C、數(shù)據(jù)庫查詢后直接進行處理接下來的請求,那么上一個請求中剩下的 D、E、F 幾個步驟怎么辦呢?

如果大家還沒有忘記上一小節(jié)內容的話應該知道,這有兩種情況,我們來分別討論。

1,主線程不關心數(shù)據(jù)庫操作結果

在這種情況下,主線程根本就不關心數(shù)據(jù)庫是否查詢完畢,數(shù)據(jù)庫查詢完畢后自行處理接下來的 D、E、F 三個步驟,就像這樣:

看到了吧,接下來重點來了哦。

我們說過一個請求需要經過七個步驟,其中前三個是在主線程中完成的,后四個是在數(shù)據(jù)庫線程中完成的,那么數(shù)據(jù)庫線程是怎么知道查完數(shù)據(jù)庫后要處理 D、E、F 這幾個步驟呢?

這時,我們的另一個主角回調函數(shù)就開始登場啦。

沒錯,回調函數(shù)就是用來解決這一問題的。

我們可以將處理 D、E、F 這幾個步驟封裝到一個函數(shù)中,假定將該函數(shù)命名為handle_DEF_after_DB_query:

void handle_DEF_after_DB_query () {
    D;
    E;
    F;
}

這樣主線程在發(fā)送數(shù)據(jù)庫查詢請求的同時將該函數(shù)一并當做參數(shù)傳遞過去

DB_query(request, handle_DEF_after_DB_query);

數(shù)據(jù)庫線程處理完后直接調用handle_DEF_after_DB_query就可以了,這就是回調函數(shù)的作用。

也有的同學可能會有疑問,為什么這個函數(shù)要傳遞給數(shù)據(jù)庫線程而不是數(shù)據(jù)庫線程自己定義自己調用呢?

因為從軟件組織結構上講,這不是數(shù)據(jù)庫線程該做的工作

數(shù)據(jù)庫線程需要做的僅僅就是查詢數(shù)據(jù)庫、然后調用一個處理函數(shù),至于這個處理函數(shù)做了些什么數(shù)據(jù)庫線程根本就不關心,也不應該關心

你可以傳入各種各樣的回調函數(shù)。也就是說數(shù)據(jù)庫系統(tǒng)可以針對回調函數(shù)這一抽象的函數(shù)變量來編程,從而更好的應對變化,因為回調函數(shù)的內容改變不會影響到數(shù)據(jù)庫線程的邏輯,而如果數(shù)據(jù)庫線程自己定義處理函數(shù)那么這種設計就沒有靈活性可言了。

而從軟件開發(fā)的角度看,假設數(shù)據(jù)庫線程邏輯封裝為了庫提供給其它團隊,當數(shù)據(jù)庫團隊在研發(fā)時怎么可能知道數(shù)據(jù)庫查詢后該做什么呢?

顯然,只有使用方才知道查詢完數(shù)據(jù)庫后該做些什么,因此使用方在使用時簡單的傳入這個回調函數(shù)就可以了。

這樣復雜數(shù)據(jù)庫的團隊就和使用方團隊實現(xiàn)了所謂的解耦

現(xiàn)在你應該明白回調函數(shù)的作用了吧。

如果你覺得有幫到你,請伸出你的小手幫忙分享再看一下,原創(chuàng)不易,你的一個在看是對博主最大的肯定,拜托大家啦。

不容易啊,容我喝口水叉會兒腰歇一歇。

我們繼續(xù)。

另外仔細觀察上面兩張圖,你能看出為什么異步比同步高效嗎?

原因很簡單,這也是我們在本篇提到過的,異步天然就無需等待,無依賴。

從上一張圖中我們可以看到主線程的“休閑時光”不見了,取而代之的是不斷的工作、工作、工作,就像苦逼的 996 程序員一樣,而且數(shù)據(jù)庫線程也沒有那么大段大段的空閑了,取而代之的也是工作、工作、工作。

主線程處理請求和數(shù)據(jù)庫處理查詢請求可以同時進行,因此從系統(tǒng)性能上看,這樣的設計能更加充分的利用系統(tǒng)資源,更加快速的處理請求;從用戶的角度看,系統(tǒng)的響應也會更加迅速。

這就是異步的高效之處。

但我們應該也可以看出,異步編程并不如同步來的容易理解,系統(tǒng)可維護性上也不如同步模式。

那么有沒有一種方法既能結合同步模式的容易理解又能結合異步模式的高效呢?答案是肯定的,我們將在后續(xù)章節(jié)詳細講解這一技術。

接下來我們看第二種情況,那就是主線程需要關心數(shù)據(jù)庫查詢結果。

2. 主線程關心數(shù)據(jù)庫操作結果

在這種情況下,數(shù)據(jù)庫線程需要將查詢結果利用通知機制發(fā)送給主線程,主線程在接收到消息后繼續(xù)處理上一個請求的后半部分,就像這樣:

從這里我們可以看到,ABCDEF 幾個步驟全部在主線中處理,同時主線程同樣也沒有了“休閑時光”,只不過在這種情況下數(shù)據(jù)庫線程是比較清閑的,從這里并沒有上一種方法高效,但是依然要比同步模式下要高效。

最后需要注意的是,并不是所有的情況下異步都一定比同步高效,還需要結合具體業(yè)務以及 IO 的復雜度具體情況具體分析。

總結

在這篇文章中我們從各種場景分析了同步與異步這兩個概念,但是不管在什么場景下,同步往往意味著雙方要相互等待、相互依賴,而異步意味著雙方相互獨立、各行其是。希望本篇能對大家理解這兩個重要的概念有所幫助。

來源:公眾號

作者: 碼農的荒島求生

1 人點贊