Spark SQL是應(yīng)用于Spark的一個(gè)組件,至于它的具體用途,會(huì)在本教程當(dāng)中為諸位進(jìn)行講解。
Apache Spark是一種快速計(jì)算的快速集群計(jì)算。 它建立在Hadoop MapReduce之上,它擴(kuò)展了MapReduce模型,以有效地使用更多類型的計(jì)算,包括交互式查詢和流處理。 這是一個(gè)簡(jiǎn)短的教程,解釋Spark SQL編程的基礎(chǔ)。
適用人群
本教程是為期望使用Spark Framework學(xué)習(xí)大數(shù)據(jù)分析基礎(chǔ)知識(shí)并成為Spark開發(fā)人員的專業(yè)人士準(zhǔn)備的。 此外,它對(duì)于Google Analytics專業(yè)人員和ETL開發(fā)人員也很有用。
學(xué)習(xí)前提
在開始執(zhí)行本教程之前,我們假設(shè)您先前已經(jīng)學(xué)習(xí)了Scala編程,數(shù)據(jù)庫概念和任意Linux操作系統(tǒng)風(fēng)格。
相關(guān)手冊(cè)
Scala教程:http://m.hgci.cn/Scala/
SQL教程:http://m.hgci.cn/sql/
Linux教程:http://m.hgci.cn/linux/
JAVA教程:http://m.hgci.cn/java/
拓展閱讀
Spark SQL官方文檔:http://spark.apache.org/docs/latest/sql-programming-guide.html
Spark SQL下載地址:http://spark.apache.org/downloads.html
Spark SQL實(shí)例介紹:http://spark.apache.org/examples.html