W3Cschool
恭喜您成為首批注冊用戶
獲得88經(jīng)驗值獎勵
運行一個Spark Streaming應(yīng)用程序,有下面一些步驟
TwitterUtils
,那么就需要將spark-streaming-twitter_2.10
以及它的所有依賴打包到應(yīng)用程序jar中。配置應(yīng)用程序driver的自動重啟-為了自動從driver故障中恢復(fù),運行流應(yīng)用程序的部署設(shè)施必須能監(jiān)控driver進程,如果失敗了能夠重啟它。不同的集群管理器,有不同的工具得到該功能
Mesos: Mesos可以用Marathon提供該功能
spark.streaming.receiver.writeAheadLogs.enable
為true來開啟。然而,這些較強的語義可能以receiver的接收吞吐量為代價。這可以通過并行運行多個receiver增加吞吐量來解決。另外,當(dāng)預(yù)寫日志開啟時,Spark中的復(fù)制數(shù)據(jù)的功能推薦不用,因為該日志已經(jīng)存儲在了一個副本在存儲系統(tǒng)中。可以通過設(shè)置輸入DStream的存儲級別為StorageLevel.MEMORY_AND_DISK_SER
獲得該功能。如果運行的Spark Streaming應(yīng)用程序需要升級,有兩種可能的方法
StreamingContext.stop(...)
或JavaStreamingContext.stop(...)
)現(xiàn)有的應(yīng)用程序。在關(guān)閉之前,要保證已經(jīng)接收的數(shù)據(jù)完全處理完。然后,就可以啟動升級的應(yīng)用程序,升級的應(yīng)用程序會接著舊應(yīng)用程序的點開始處理。這種方法僅支持具有源端緩存功能的輸入源(如flume,kafka),這是因為當(dāng)舊的應(yīng)用程序已經(jīng)關(guān)閉,升級的應(yīng)用程序還沒有啟動的時候,數(shù)據(jù)需要被緩存。Copyright©2021 w3cschool編程獅|閩ICP備15016281號-3|閩公網(wǎng)安備35020302033924號
違法和不良信息舉報電話:173-0602-2364|舉報郵箱:jubao@eeedong.com
掃描二維碼
下載編程獅App
編程獅公眾號
聯(lián)系方式:
更多建議: