ZooKeeper 是一種分布式協(xié)調(diào)服務(wù),用于管理大型主機。在分布式環(huán)境中協(xié)調(diào)和管理服務(wù)是一個復雜的過程。ZooKeeper 通過其簡單的架構(gòu)和 API 解決了這個問題。ZooKeeper 允許開發(fā)人員專注于核心應(yīng)用程序邏輯,而不必擔心應(yīng)用程序的分布式特性。
ZooKeeper 框架最初是在“Yahoo!"上構(gòu)建的,用于以簡單而穩(wěn)健的方式訪問他們的應(yīng)用程序。 后來,Apache ZooKeeper 成為 Hadoop,HBase 和其他分布式框架使用的有組織服務(wù)的標準。 例如,Apache HBase 使用 ZooKeeper 跟蹤分布式數(shù)據(jù)的狀態(tài)。
在進一步深入之前,我們了解關(guān)于分布式應(yīng)用的一兩件事情是很重要的。因此,讓我們開始分布式應(yīng)用的概述的快速討論。
分布式應(yīng)用可以在給定時間(同時)在網(wǎng)絡(luò)中的多個系統(tǒng)上運行,通過協(xié)調(diào)它們以快速有效的方式完成特定任務(wù)。通常來說,對于復雜而耗時的任務(wù),非分布式應(yīng)用(運行在單個系統(tǒng)中)需要幾個小時才能完成,而分布式應(yīng)用通過使用所有系統(tǒng)涉及的計算能力可以在幾分鐘內(nèi)完成。
通過將分布式應(yīng)用配置為在更多系統(tǒng)上運行,可以進一步減少完成任務(wù)的時間。分布式應(yīng)用正在運行的一組系統(tǒng)稱為集群,而在集群中運行的每臺機器被稱為節(jié)點。
分布式應(yīng)用有兩部分, Server(服務(wù)器) 和 Client(客戶端) 應(yīng)用程序。服務(wù)器應(yīng)用程序?qū)嶋H上是分布式的,并具有通用接口,以便客戶端可以連接到集群中的任何服務(wù)器并獲得相同的結(jié)果。 客戶端應(yīng)用程序是與分布式應(yīng)用進行交互的工具。
可靠性 - 單個或幾個系統(tǒng)的故障不會使整個系統(tǒng)出現(xiàn)故障。
可擴展性 - 可以在需要時增加性能,通過添加更多機器,在應(yīng)用程序配置中進行微小的更改,而不會有停機時間。
透明性 - 隱藏系統(tǒng)的復雜性,并將其顯示為單個實體/應(yīng)用程序。
競爭條件 - 兩個或多個機器嘗試執(zhí)行特定任務(wù),實際上只需在任意給定時間由單個機器完成。例如,共享資源只能在任意給定時間由單個機器修改。
死鎖 - 兩個或多個操作等待彼此無限期完成。
不一致 - 數(shù)據(jù)的部分失敗。
Apache ZooKeeper是由集群(節(jié)點組)使用的一種服務(wù),用于在自身之間協(xié)調(diào),并通過穩(wěn)健的同步技術(shù)維護共享數(shù)據(jù)。ZooKeeper本身是一個分布式應(yīng)用程序,為寫入分布式應(yīng)用程序提供服務(wù)。
ZooKeeper提供的常見服務(wù)如下 :
命名服務(wù) - 按名稱標識集群中的節(jié)點。它類似于DNS,但僅對于節(jié)點。
配置管理 - 加入節(jié)點的最近的和最新的系統(tǒng)配置信息。
集群管理 - 實時地在集群和節(jié)點狀態(tài)中加入/離開節(jié)點。
選舉算法 - 選舉一個節(jié)點作為協(xié)調(diào)目的的leader。
鎖定和同步服務(wù) - 在修改數(shù)據(jù)的同時鎖定數(shù)據(jù)。此機制可幫助你在連接其他分布式應(yīng)用程序(如Apache HBase)時進行自動故障恢復。
高度可靠的數(shù)據(jù)注冊表 - 即使在一個或幾個節(jié)點關(guān)閉時也可以獲得數(shù)據(jù)。
分布式應(yīng)用程序提供了很多好處,但它們也拋出了一些復雜和難以解決的挑戰(zhàn)。ZooKeeper框架提供了一個完整的機制來克服所有的挑戰(zhàn)。競爭條件和死鎖使用故障安全同步方法進行處理。另一個主要缺點是數(shù)據(jù)的不一致性,ZooKeeper使用原子性解析。
以下是使用ZooKeeper的好處:
簡單的分布式協(xié)調(diào)過程
同步 - 服務(wù)器進程之間的相互排斥和協(xié)作。此過程有助于Apache HBase進行配置管理。
有序的消息
序列化 - 根據(jù)特定規(guī)則對數(shù)據(jù)進行編碼。確保應(yīng)用程序運行一致。這種方法可以在MapReduce中用來協(xié)調(diào)隊列以執(zhí)行運行的線程。
可靠性
原子性 - 數(shù)據(jù)轉(zhuǎn)移完全成功或完全失敗,但沒有事務(wù)是部分的。
更多建議: