W3Cschool
恭喜您成為首批注冊用戶
獲得88經(jīng)驗值獎勵
為了初始化Spark Streaming程序,一個StreamingContext對象必需被創(chuàng)建,它是Spark Streaming所有流操作的主要入口。一個StreamingContext對象可以用SparkConf對象創(chuàng)建。
import org.apache.spark._
import org.apache.spark.streaming._
val conf = new SparkConf().setAppName(appName).setMaster(master)
val ssc = new StreamingContext(conf, Seconds(1))
appName
表示你的應用程序顯示在集群UI上的名字,master
是一個Spark、Mesos、YARN集群URL或者一個特殊字符串“l(fā)ocal[*]”,它表示程序用本地模式運行。當程序運行在集群中時,你并不希望在程序中硬編碼master
,而是希望用spark-submit
啟動應用程序,并從spark-submit
中得到master
的值。對于本地測試或者單元測試,你可以傳遞“l(fā)ocal”字符串在同一個進程內運行Spark Streaming。需要注意的是,它在內部創(chuàng)建了一個SparkContext對象,你可以通過ssc.sparkContext
訪問這個SparkContext對象。
批時間片需要根據(jù)你的程序的潛在需求以及集群的可用資源來設定,你可以在性能調優(yōu)那一節(jié)獲取詳細的信息。
可以利用已經(jīng)存在的SparkContext
對象創(chuàng)建StreamingContext
對象。
import org.apache.spark.streaming._
val sc = ... // existing SparkContext
val ssc = new StreamingContext(sc, Seconds(1))
當一個上下文(context)定義之后,你必須按照以下幾步進行操作
streamingContext.start()
方法接收和處理數(shù)據(jù);streamingContext.stop()
方法被調用。幾點需要注意的地方:
stop()
方法,也會關閉SparkContext對象。如果只想僅關閉StreamingContext對象,設置stop()
的可選參數(shù)為falseCopyright©2021 w3cschool編程獅|閩ICP備15016281號-3|閩公網(wǎng)安備35020302033924號
違法和不良信息舉報電話:173-0602-2364|舉報郵箱:jubao@eeedong.com
掃描二維碼
下載編程獅App
編程獅公眾號
聯(lián)系方式:
更多建議: