SAS箱線圖

2018-12-14 20:04 更新

箱線圖是通過(guò)其四分位數(shù)的數(shù)字?jǐn)?shù)據(jù)組的圖形表示。 箱形圖具有從箱(晶須)垂直延伸的線,表示上部和下部四分位數(shù)之外的變化。 箱子的底部和頂部總是第一和第三四分位數(shù),箱子內(nèi)的帶總是第二四分位數(shù)(中位數(shù))。 在SAS中,使用PROC SGPLOT創(chuàng)建一個(gè)簡(jiǎn)單的箱線圖,使用PROC SGPANEL創(chuàng)建鑲板箱線圖。
請(qǐng)注意,我們?cè)诘谝粋€(gè)示例中創(chuàng)建名為CARS1的數(shù)據(jù)集,并對(duì)所有后續(xù)數(shù)據(jù)集使用相同的數(shù)據(jù)集。 此數(shù)據(jù)集保留在工作庫(kù)中,直到SAS會(huì)話結(jié)束。

句法

基本的語(yǔ)法來(lái)創(chuàng)建一個(gè)箱線圖在SAS是:

PROC SGPLOT  DATA=DATASET;
  VBOX VARIABLE / category = VARIABLE;
RUN; 

PROC SGPANEL  DATA=DATASET;;
PANELBY VARIABLE;
  VBOX VARIABLE> / category = VARIABLE;
RUN; 

以下是使用的參數(shù)的描述:

  • DATASET是所使用的數(shù)據(jù)集的名稱。
  • VARIABLE是用于繪制Boxplot的值。

簡(jiǎn)單的箱形圖

在一個(gè)簡(jiǎn)單的箱線圖中,我們從數(shù)據(jù)集中選擇一個(gè)變量,另一個(gè)變量形成一個(gè)類(lèi)別。 第一變量的值被分類(lèi)為與第二變量中的不同值的數(shù)量一樣多的組數(shù)。

在下面的示例中,我們選擇變量馬力作為第一個(gè)變量,并鍵入類(lèi)別變量。 因此,我們得到每種類(lèi)型的汽車(chē)的馬力值分布的箱線圖。

PROC SQL;
create table CARS1 as
SELECT make,model,type,invoice,horsepower,length,weight
 FROM 
SASHELP.CARS
WHERE make in ('Audi','BMW')
;
RUN;

PROC SGPLOT  DATA=CARS1;
  VBOX horsepower 
  / category = type;

   title 'Horsepower of cars by types';
RUN; 

垂直面板中的箱線圖

我們可以將一個(gè)變量的Boxplots分成許多垂直面板(列)。 每個(gè)面板包含所有分類(lèi)變量的箱線圖。 但是盒圖使用另一個(gè)第三個(gè)變量進(jìn)一步分組,該圖將該圖分成多個(gè)面板。

在下面的例子中,我們使用變量'make'來(lái)繪制圖形。 因?yàn)?#39;make'有兩個(gè)不同的值,所以我們得到兩個(gè)垂直面板。

PROC SGPANEL  DATA=CARS1;
PANELBY MAKE;
  VBOX horsepower   / category = type;

   title 'Horsepower of cars by types';
RUN; 

當(dāng)我們執(zhí)行上面的代碼,我們得到以下的輸出:

水平面板中的箱形圖

我們可以將一個(gè)變量的Boxplots分成許多水平面板(行)。 每個(gè)面板包含所有分類(lèi)變量的箱線圖。 但是盒圖使用另一個(gè)第三個(gè)變量進(jìn)一步分組,該圖將該圖分成多個(gè)面板。 在下面的例子中,我們使用變量'make'來(lái)繪制圖形。 因?yàn)?#39;make'有兩個(gè)不同的值,所以我們得到兩個(gè)水平面板。

PROC SGPANEL  DATA=CARS1;
PANELBY MAKE / columns = 1 novarname;

  VBOX horsepower   / category = type;

   title 'Horsepower of cars by types';
RUN; 


以上內(nèi)容是否對(duì)您有幫助:
在線筆記
App下載
App下載

掃描二維碼

下載編程獅App

公眾號(hào)
微信公眾號(hào)

編程獅公眾號(hào)