R 生物統計學/匯入
與 SPSS、SAS 和 MINITAB 等常用統計軟體包相比,R 更出色,因為它
- 強大
- 適用於多種平臺(Mac OS X、Windows、Linux 等)
- 可程式設計
- 非商業化
- 文件齊全
您可以參考 R 常見問題解答
Wiley 網站上提供的資料集格式包括 CSV、Excel、MINITAB、SAS 和 SPSS。雖然您可以使用 foreign 包將儲存在 Excel、SAS 和 SPSS 中的資料匯入 R,但您應該下載 CSV 格式的資料。這是因為 CSV 在 R 中處理起來最容易。
例如,您想匯入“大型資料集”資料檔案。下載的資料檔案 (LDS_C02_NCBIRTH800.csv),假設儲存在目錄“/desktop”中,可以使用以下語法將其匯入 R 作為名為“largedataset”的資料框
> largedataset <- read.csv("/Desktop/LDS_C02_NCBIRTH800.csv", header=TRUE,na.strings="NA")
如果您更喜歡使用標準的“點選”方式選擇資料檔案,您可以使用 file.choose() 函式,即
largedataset <- read.csv(file.choose(), header=TRUE,na.strings="NA")
現在,您應該將資料從 CSV 匯入到名為“largedataset”的資料框中。您可以嘗試透過呼叫其名稱來檢視資料框的內容
> largedataset
您可以透過以下方式訪問 largedataset 資料框中的“sex”(在計算機術語中稱為列)變數
largedataset$sex
例如,您想統計 sex 的頻率
> table(largedataset$sex)
您可以附加資料框,以便可以直接呼叫變數
> attach(largedataset) > table(sex) > detach() #cancel attaching
R 被設計為一個分析系統,而不是像 SPSS 這樣的整合環境。與 SPSS 不同,R 沒有像電子表格一樣的環境用於資料輸入。通常情況下,資料使用不同的軟體(例如資料庫、電子表格軟體,如 OO.o Calc)輸入,然後如上所述匯入到 R 中。對於快速的一次性計算,您可以在 R 中進行資料輸入。例如,如果您想計算十名患者的平均年齡(30、31、32、34、35、36、37、30、40、45),您可以使用 c() 函式將資料輸入 R 中。
> pt_age <- c(30,31,32,34,35,36,37,30,40,45)
您可以透過其名稱呼叫新建立的物件 pt_age...
> pt_age
...然後計算十名患者的平均年齡。
> mean (pt_age)