W3Cschool
恭喜您成為首批注冊用戶
獲得88經(jīng)驗值獎勵
Spark SQL允許Spark執(zhí)行用SQL, HiveQL或者Scala表示的關(guān)系查詢。這個模塊的核心是一個新類型的RDD-SchemaRDD。SchemaRDDs由行對象組成,行對象擁有一個模式(scheme)來描述行中每一列的數(shù)據(jù)類型。SchemaRDD與關(guān)系型數(shù)據(jù)庫中的表很相似??梢酝ㄟ^存在的RDD、一個Parquet文件、一個JSON數(shù)據(jù)庫或者對存儲在Apache Hive中的數(shù)據(jù)執(zhí)行HiveSQL查詢中創(chuàng)建。
本章的所有例子都利用了Spark分布式系統(tǒng)中的樣本數(shù)據(jù),可以在spark-shell
中運行它們。
Copyright©2021 w3cschool編程獅|閩ICP備15016281號-3|閩公網(wǎng)安備35020302033924號
違法和不良信息舉報電話:173-0602-2364|舉報郵箱:jubao@eeedong.com
掃描二維碼
下載編程獅App
編程獅公眾號
聯(lián)系方式:
更多建議: