W3Cschool
恭喜您成為首批注冊用戶
獲得88經(jīng)驗(yàn)值獎(jiǎng)勵(lì)
Spark 核心的概念是 Resilient Distributed Dataset (RDD):一個(gè)可并行操作的有容錯(cuò)機(jī)制的數(shù)據(jù)集合。有 2 種方式創(chuàng)建 RDDs:第一種是在你的驅(qū)動(dòng)程序中并行化一個(gè)已經(jīng)存在的集合;另外一種是引用一個(gè)外部存儲系統(tǒng)的數(shù)據(jù)集,例如共享的文件系統(tǒng),HDFS,HBase或其他 Hadoop 數(shù)據(jù)格式的數(shù)據(jù)源。
Copyright©2021 w3cschool編程獅|閩ICP備15016281號-3|閩公網(wǎng)安備35020302033924號
違法和不良信息舉報(bào)電話:173-0602-2364|舉報(bào)郵箱:jubao@eeedong.com
掃描二維碼
下載編程獅App
編程獅公眾號
聯(lián)系方式:
更多建議: