W3Cschool
恭喜您成為首批注冊(cè)用戶
獲得88經(jīng)驗(yàn)值獎(jiǎng)勵(lì)
高可用HA(High Availability)是分布式系統(tǒng)架構(gòu)設(shè)計(jì)中必須考慮的因素之一,它通常是指,通過設(shè)計(jì)減少系統(tǒng)不能提供服務(wù)的時(shí)間。
假設(shè)系統(tǒng)一直能夠提供服務(wù),我們說系統(tǒng)的可用性是100%。
如果系統(tǒng)每運(yùn)行100個(gè)時(shí)間單位,會(huì)有1個(gè)時(shí)間單位無法提供服務(wù),我們說系統(tǒng)的可用性是99%。
很多公司的高可用目標(biāo)是4個(gè)9,也就是99.99%,這就意味著,系統(tǒng)的年停機(jī)時(shí)間為8.76個(gè)小時(shí)。
百度的搜索首頁,是業(yè)內(nèi)公認(rèn)高可用保障非常出色的系統(tǒng),甚至人們會(huì)通過www.baidu.com 能不能訪問來判斷“網(wǎng)絡(luò)的連通性”,百度高可用的服務(wù)讓人留下啦“網(wǎng)絡(luò)通暢,百度就能訪問”,“百度打不開,應(yīng)該是網(wǎng)絡(luò)連不上”的印象,這其實(shí)是對(duì)百度HA最高的褒獎(jiǎng)。
我們都知道,單點(diǎn)是系統(tǒng)高可用的大敵,單點(diǎn)往往是系統(tǒng)高可用最大的風(fēng)險(xiǎn)和敵人,應(yīng)該盡量在系統(tǒng)設(shè)計(jì)的過程中避免單點(diǎn)。方法論上,高可用保證的原則是“集群化”,或者叫“冗余”:只有一個(gè)單點(diǎn),掛了服務(wù)會(huì)受影響;如果有冗余備份,掛了還有其他backup能夠頂上。
保證系統(tǒng)高可用,架構(gòu)設(shè)計(jì)的核心準(zhǔn)則是:冗余。
有了冗余之后,還不夠,每次出現(xiàn)故障需要人工介入恢復(fù)勢(shì)必會(huì)增加系統(tǒng)的不可服務(wù)實(shí)踐。所以,又往往是通過“自動(dòng)故障轉(zhuǎn)移”來實(shí)現(xiàn)系統(tǒng)的高可用。
接下來我們看下典型互聯(lián)網(wǎng)架構(gòu)中,如何通過冗余+自動(dòng)故障轉(zhuǎn)移來保證系統(tǒng)的高可用特性。
常見互聯(lián)網(wǎng)分布式架構(gòu)如上,分為:
(1)客戶端層:典型調(diào)用方是瀏覽器browser或者手機(jī)應(yīng)用APP
(2)反向代理層:系統(tǒng)入口,反向代理
(3)站點(diǎn)應(yīng)用層:實(shí)現(xiàn)核心應(yīng)用邏輯,返回html或者json
(4)服務(wù)層:如果實(shí)現(xiàn)了服務(wù)化,就有這一層
(5)數(shù)據(jù)-緩存層:緩存加速訪問存儲(chǔ)
(6)數(shù)據(jù)-數(shù)據(jù)庫層:數(shù)據(jù)庫固化數(shù)據(jù)存儲(chǔ)
整個(gè)系統(tǒng)的高可用,又是通過每一層的冗余+自動(dòng)故障轉(zhuǎn)移來綜合實(shí)現(xiàn)的。
【客戶端層->反向代理層】的高可用
【服務(wù)層】到【緩存層】的高可用,是通過緩存數(shù)據(jù)的冗余來實(shí)現(xiàn)的。
緩存層的數(shù)據(jù)冗余又有幾種方式:第一種是利用客戶端的封裝,service對(duì)cache進(jìn)行雙讀或者雙寫。
緩存層也可以通過支持主從同步的緩存集群來解決緩存層的高可用問題。
以redis為例,redis天然支持主從同步,redis官方也有sentinel哨兵機(jī)制,來做redis的存活性檢測(cè)。
說完緩存的高可用,這里要多說一句,業(yè)務(wù)對(duì)緩存并不一定有“高可用”要求,更多的對(duì)緩存的使用場(chǎng)景,是用來“加速數(shù)據(jù)訪問”:把一部分?jǐn)?shù)據(jù)放到緩存里,如果緩存掛了或者緩存沒有命中,是可以去后端的數(shù)據(jù)庫中再取數(shù)據(jù)的。
這類允許“cache miss”的業(yè)務(wù)場(chǎng)景,緩存架構(gòu)的建議是:
【服務(wù)層>數(shù)據(jù)庫層】的高可用
大部分互聯(lián)網(wǎng)技術(shù),數(shù)據(jù)庫層都用了“主從同步,讀寫分離”架構(gòu),所以數(shù)據(jù)庫層的高可用,又分為“讀庫高可用”與“寫庫高可用”兩類。
【服務(wù)層】到【數(shù)據(jù)庫讀】的高可用,是通過讀庫的冗余來實(shí)現(xiàn)的。
既然冗余了讀庫,一般來說就至少有2個(gè)從庫,“數(shù)據(jù)庫連接池”會(huì)建立與讀庫多個(gè)連接,每次請(qǐng)求會(huì)路由到這些讀庫。
【服務(wù)層】到【數(shù)據(jù)庫寫】的高可用,是通過寫庫的冗余來實(shí)現(xiàn)的。
以mysql為例,可以設(shè)置兩個(gè)mysql雙主同步,一臺(tái)對(duì)線上提供服務(wù),另一臺(tái)冗余以保證高可用,常見的實(shí)踐是keepalived存活探測(cè),相同virtual IP提供服務(wù)。
高可用HA(High Availability)是分布式系統(tǒng)架構(gòu)設(shè)計(jì)中必須考慮的因素之一,它通常是指,通過設(shè)計(jì)減少系統(tǒng)不能提供服務(wù)的時(shí)間。
方法論上,高可用是通過冗余+自動(dòng)故障轉(zhuǎn)移來實(shí)現(xiàn)的。
整個(gè)互聯(lián)網(wǎng)分層系統(tǒng)架構(gòu)的高可用,又是通過每一層的冗余+自動(dòng)故障轉(zhuǎn)移來綜合實(shí)現(xiàn)的,具體的:
(1)【客戶端層】到【反向代理層】的高可用,是通過反向代理層的冗余實(shí)現(xiàn)的,常見實(shí)踐是keepalived + virtual IP自動(dòng)故障轉(zhuǎn)移
(2)【反向代理層】到【站點(diǎn)層】的高可用,是通過站點(diǎn)層的冗余實(shí)現(xiàn)的,常見實(shí)踐是nginx與web-server之間的存活性探測(cè)與自動(dòng)故障轉(zhuǎn)移
(3)【站點(diǎn)層】到【服務(wù)層】的高可用,是通過服務(wù)層的冗余實(shí)現(xiàn)的,常見實(shí)踐是通過service-connection-pool來保證自動(dòng)故障轉(zhuǎn)移
(4)【服務(wù)層】到【緩存層】的高可用,是通過緩存數(shù)據(jù)的冗余實(shí)現(xiàn)的,常見實(shí)踐是緩存客戶端雙讀雙寫,或者利用緩存集群的主從數(shù)據(jù)同步與sentinel?;钆c自動(dòng)故障轉(zhuǎn)移;更多的業(yè)務(wù)場(chǎng)景,對(duì)緩存沒有高可用要求,可以使用緩存服務(wù)化來對(duì)調(diào)用方屏蔽底層復(fù)雜性
(5)【服務(wù)層】到【數(shù)據(jù)庫“讀”】的高可用,是通過讀庫的冗余實(shí)現(xiàn)的,常見實(shí)踐是通過db-connection-pool來保證自動(dòng)故障轉(zhuǎn)移
(6)【服務(wù)層】到【數(shù)據(jù)庫“寫”】的高可用,是通過寫庫的冗余實(shí)現(xiàn)的,常見實(shí)踐是keepalived + virtual IP自動(dòng)故障轉(zhuǎn)移
Copyright©2021 w3cschool編程獅|閩ICP備15016281號(hào)-3|閩公網(wǎng)安備35020302033924號(hào)
違法和不良信息舉報(bào)電話:173-0602-2364|舉報(bào)郵箱:jubao@eeedong.com
掃描二維碼
下載編程獅App
編程獅公眾號(hào)
聯(lián)系方式:
更多建議: