Stata/描述性統計
外觀
< Stata
在本節中,我們展示瞭如何使用 Stata 進行彙總統計。本節包括三個小節。第一個介紹描述整個資料集的命令,第二個介紹描述單個變數的命令,第三個介紹描述一組變數的命令。
- 'des' (describe) : 提供檔案大小、觀察值數量、變數數量、每個變數的列表、標籤和型別。
- 'des, s' (describe short) : 僅提供檔案大小、觀察值數量、變數數量。
- 'des' 返回自上次儲存以來的更改次數、變數數量 'r(k)'、觀察值數量 'r(N)'。
. sysuse cancer, clear (Patient Survival in Drug Trial) . describe . des, s . ret list
- codebook
- inspect
- su
- su, d
- robmean : 穩健均值
- ta
- corr 返回一組變數之間線性相關係數的矩陣。
- corr, cov 返回協方差矩陣。
以下是一個示例。我們首先模擬一個 y 和 x,它們之間存在正相關關係。我們繪製這兩個變數並檢視它們的關聯性。
. clear
. set obs 1000
. gen x = invnorm(uniform())
. gen u = invnorm(uniform())
. gen y = x + u
. tw sc y x || lfit y x
. corr y x
(obs=1000)
| y x
-------------+------------------
y | 1.0000
x | 0.7197 1.0000
- wincorr 返回 Winsorized 相關性 : 極端值被替換為極限值。如果一些極端值對相關係數有很大影響,這將很有用。
- spearman 和 spearman2 給出兩個變數之間的 Spearman 秩相關係數。該統計量對異常值的敏感度低於 Pearson 線性相關係數。這通常用作穩健性檢查。
. spearman y x
Number of obs = 1000
Spearman's rho = 0.7090
Test of Ho: y and x are independent
Prob > |t| = 0.0000
- ta
- catgraph : 繪製按類別劃分的連續變數的均值
- table