W3Cschool
恭喜您成為首批注冊(cè)用戶
獲得88經(jīng)驗(yàn)值獎(jiǎng)勵(lì)
在隨機(jī)森林方法中,創(chuàng)建大量的決策樹(shù)。 每個(gè)觀察被饋入每個(gè)決策樹(shù)。 每個(gè)觀察的最常見(jiàn)的結(jié)果被用作最終輸出。 新的觀察結(jié)果被饋入所有的樹(shù)并且對(duì)每個(gè)分類(lèi)模型取多數(shù)投票。
對(duì)構(gòu)建樹(shù)時(shí)未使用的情況進(jìn)行錯(cuò)誤估計(jì)。 這稱(chēng)為OOB(袋外)誤差估計(jì),其被提及為百分比。
R語(yǔ)言包“randomForest”用于創(chuàng)建隨機(jī)森林。
在R語(yǔ)言控制臺(tái)中使用以下命令安裝軟件包。 您還必須安裝相關(guān)軟件包(如果有)。
install.packages("randomForest")
包“randomForest”具有函數(shù)randomForest(),用于創(chuàng)建和分析隨機(jī)森林。
在R語(yǔ)言中創(chuàng)建隨機(jī)森林的基本語(yǔ)法是 -
randomForest(formula, data)
以下是所使用的參數(shù)的描述 -
formula是描述預(yù)測(cè)變量和響應(yīng)變量的公式。
data是所使用的數(shù)據(jù)集的名稱(chēng)。
我們將使用名為readingSkills的R語(yǔ)言內(nèi)置數(shù)據(jù)集來(lái)創(chuàng)建決策樹(shù)。 它描述了某人的readingSkills的分?jǐn)?shù),如果我們知道變量“age”,“shoesize”,“score”,以及該人是否是母語(yǔ)。
以下是示例數(shù)據(jù)。
# Load the party package. It will automatically load other required packages. library(party) # Print some records from data set readingSkills. print(head(readingSkills))
當(dāng)我們執(zhí)行上面的代碼,它產(chǎn)生以下結(jié)果及圖表 -
nativeSpeaker age shoeSize score 1 yes 5 24.83189 32.29385 2 yes 6 25.95238 36.63105 3 no 11 30.42170 49.60593 4 yes 7 28.66450 40.28456 5 yes 11 31.88207 55.46085 6 yes 10 30.07843 52.83124 Loading required package: methods Loading required package: grid ............................... ...............................
我們將使用randomForest()函數(shù)來(lái)創(chuàng)建決策樹(shù)并查看它的圖。
# Load the party package. It will automatically load other required packages. library(party) library(randomForest) # Create the forest. output.forest <- randomForest(nativeSpeaker ~ age + shoeSize + score, data = readingSkills) # View the forest results. print(output.forest) # Importance of each predictor. print(importance(output.forest,type = 2))
當(dāng)我們執(zhí)行上面的代碼,它產(chǎn)生以下結(jié)果 -
Call: randomForest(formula = nativeSpeaker ~ age + shoeSize + score, data = readingSkills) Type of random forest: classification Number of trees: 500 No. of variables tried at each split: 1 OOB estimate of error rate: 1% Confusion matrix: no yes class.error no 99 1 0.01 yes 1 99 0.01 MeanDecreaseGini age 13.95406 shoeSize 18.91006 score 56.73051
從上面顯示的隨機(jī)森林,我們可以得出結(jié)論,鞋碼和成績(jī)是決定如果某人是母語(yǔ)者或不是母語(yǔ)的重要因素。 此外,該模型只有1%的誤差,這意味著我們可以預(yù)測(cè)精度為99%。
Copyright©2021 w3cschool編程獅|閩ICP備15016281號(hào)-3|閩公網(wǎng)安備35020302033924號(hào)
違法和不良信息舉報(bào)電話:173-0602-2364|舉報(bào)郵箱:jubao@eeedong.com
掃描二維碼
下載編程獅App
編程獅公眾號(hào)
聯(lián)系方式:
更多建議: