跳轉到內容

Stata/描述性統計

來自華夏公益教科書,開放的書籍,開放的世界

在本節中,我們展示瞭如何使用 Stata 進行彙總統計。本節包括三個小節。第一個介紹描述整個資料集的命令,第二個介紹描述單個變數的命令,第三個介紹描述一組變數的命令。

描述資料集

[編輯 | 編輯原始碼]
  • 'des' (describe) : 提供檔案大小、觀察值數量、變數數量、每個變數的列表、標籤和型別。
  • 'des, s' (describe short) : 僅提供檔案大小、觀察值數量、變數數量。
  • 'des' 返回自上次儲存以來的更改次數、變數數量 'r(k)'、觀察值數量 'r(N)'。
. sysuse cancer, clear
(Patient Survival in Drug Trial)
. describe
. des, s
. ret list
  • codebook
  • inspect

單變數統計

[編輯 | 編輯原始碼]

連續變數

[編輯 | 編輯原始碼]
  • su
  • su, d
  • robmean : 穩健均值

離散變數

[編輯 | 編輯原始碼]
  • ta

多變數統計

[編輯 | 編輯原始碼]

連續變數

[編輯 | 編輯原始碼]
  • corr 返回一組變數之間線性相關係數的矩陣。
    • corr, cov 返回協方差矩陣。

以下是一個示例。我們首先模擬一個 y 和 x,它們之間存在正相關關係。我們繪製這兩個變數並檢視它們的關聯性。

. clear
. set obs 1000 
. gen x =  invnorm(uniform())
. gen u =  invnorm(uniform())
. gen y = x + u
. tw sc y x || lfit y x
. corr y x
(obs=1000)

             |        y        x
-------------+------------------
           y |   1.0000
           x |   0.7197   1.0000

  • wincorr 返回 Winsorized 相關性 : 極端值被替換為極限值。如果一些極端值對相關係數有很大影響,這將很有用。
  • spearmanspearman2 給出兩個變數之間的 Spearman 秩相關係數。該統計量對異常值的敏感度低於 Pearson 線性相關係數。這通常用作穩健性檢查。
. spearman y x

 Number of obs =    1000
Spearman's rho =       0.7090

Test of Ho: y and x are independent
    Prob > |t| =       0.0000

離散變數

[編輯 | 編輯原始碼]
  • ta

連續和離散變數

[編輯 | 編輯原始碼]
  • catgraph : 繪製按類別劃分的連續變數的均值
  • table
華夏公益教科書