跳轉到內容

SAS/描述性統計

來自華夏公益教科書,開放的書籍,為開放的世界
< SAS

列出並描述您的資料

[編輯 | 編輯原始碼]

描述您的資料 

proc contents 返回資料集所有變數的列表及其型別。

 proc contents data= lib.data ;
 title "Describe the content of a database";
 run;

在輸出中列出您的資料 

proc print 在輸出視窗中列印資料。firstobs 選項指定要列印的第一行,obs 選項指定要列印的行數。

 proc print data= lib.data (firstobs=30 obs=40);
 title "Partial Listing";
 run;

離散變數

[編輯 | 編輯原始碼]
 proc freq data=lib_name.data_name;
 tables x1 x2 ;
 title "frequence table";
 run;
  • weight 指定權重
 proc freq data=lib_name.data_name;
 weight extri;
 tables x1 / out=temp4 outexpect;
 run;

列聯表

[編輯 | 編輯原始碼]
 proc freq data=lib_name.data_name;
 tables x1*x2 ;
 title "contingency table";
 run;

連續變數

[編輯 | 編輯原始碼]

proc means 展示 var 語句中列出的每個變數的描述性統計量,如果不存在 var 語句,則展示資料集中每個數值變數的描述性統計量。以下是一些關鍵字,可用於告訴 SAS 您希望檢視哪些統計量。

  • n : 非缺失變數的計數
  • sum : 變數的總和
  • range : 最大值減去最小值
  • mean : 平均值
  • var : 方差
  • stddev : 標準差
 proc means data= libdata n sum range mean var stddev ;
 var x1 x2;
 run;

class 語句針對 class 語句中分類變數的每個組生成統計量。weights 語句對觀測值進行加權。

 proc means data=lib_name.data_name;
 var x1 x2;
 class sexe;
 weight extri;
 run;

proc univariate 提供更多選項。它還返回分位數。還有一個histogram 語句,它可能很有用。

 proc univariate data=lib_name.data_name;
 var x1;
 histogram / normal(color=red mu=0 sigma=0.045) kernel(color=blue);
 title "Proc Univariate";
 run;

核密度估計和直方圖

[編輯 | 編輯原始碼]

如果您想進行核密度估計或直方圖,可以使用 proc univariate 以及 histogram 語句或 proc capability。

 proc univariate data=lib_name.data_name;
 var x1;
 histogram / normal(color=red mu=0 sigma=0.045) kernel(color=blue);
 title "Proc Univariate";
 run;

Proc capability 

 proc capability data=lib_name.data_name;
 histogram x1 / normal(color=red mu=0 sigma=0.045)
 kernel(color=blue);
 title "Proc Capability";
 run;


相關性和散點圖

[編輯 | 編輯原始碼]
 proc corr data=lib_name.data_name;
 var x1 x2 x3;
 weight extri;
 title3 "Linear correlation";
 run;

以下程式碼檢驗資料集 taille 中變數 x 的期望值為 1.75 的假設。

proc ttest data = taille h0=1.75 alpha=0.05;
var x;
run;
華夏公益教科書