Spark SQL教程

閱讀(252.7k) 收藏贊(4)

手冊(cè)簡(jiǎn)介

Spark SQL是應(yīng)用于Spark的一個(gè)組件，至于它的具體用途，會(huì)在本教程當(dāng)中為諸位進(jìn)行講解。

手冊(cè)說明

Apache Spark是一種快速計(jì)算的快速集群計(jì)算。它建立在Hadoop MapReduce之上，它擴(kuò)展了MapReduce模型，以有效地使用更多類型的計(jì)算，包括交互式查詢和流處理。這是一個(gè)簡(jiǎn)短的教程，解釋Spark SQL編程的基礎(chǔ)。

適用人群

本教程是為期望使用Spark Framework學(xué)習(xí)大數(shù)據(jù)分析基礎(chǔ)知識(shí)并成為Spark開發(fā)人員的專業(yè)人士準(zhǔn)備的。此外，它對(duì)于Google Analytics專業(yè)人員和ETL開發(fā)人員也很有用。

學(xué)習(xí)前提

在開始執(zhí)行本教程之前，我們假設(shè)您先前已經(jīng)學(xué)習(xí)了Scala編程，數(shù)據(jù)庫概念和任意Linux操作系統(tǒng)風(fēng)格。

相關(guān)手冊(cè)

Scala教程：http://m.hgci.cn/Scala/

SQL教程：http://m.hgci.cn/sql/

Linux教程：http://m.hgci.cn/linux/

JAVA教程：http://m.hgci.cn/java/

拓展閱讀

Spark SQL官方文檔：http://spark.apache.org/docs/latest/sql-programming-guide.html

Spark SQL下載地址：http://spark.apache.org/downloads.html

Spark SQL實(shí)例介紹：http://spark.apache.org/examples.html