跳轉到內容

醫學統計學導論/單個樣本分析

來自華夏公益教科書,開放的書本,開放的世界

單個樣本分析

[編輯 | 編輯原始碼]

在開始理論之前,我們將考慮一個簡單的例子。該例子將展示統計分析的基本組成部分,並旨在直觀地理解從這種分析中可以獲得的結果型別。

關於人體體溫的一個簡單問題是,它平均是否為 37°C?為了回答這個問題,進行了一項研究,測量了 130 個人體的溫度。資料可以在這裡下載 normtemp.dat,文件可以在 (Shoemaker, 1996) 和其中的參考文獻中找到。資料的簡要摘要如下所示,即所謂的莖葉圖


 Stem-and-leaf plot for tempC (Body Temperature / Celsius)
 tempC rounded to nearest multiple of .1
 plot in units of .1
 35s | 7
 35. | 899
 36* | 011
 36t | 222222333333
 36f | 444444555
 36s | 66666666666677777777777777
 36. | 888888888888888999999999999
 37* | 0000000000111111111111111111
 37t | 2222222333333
 37f | 44445
 37s | 7
 37. | 8
 38* | 
 38t | 2

這表明,例如,一個人(從頂部第一個)的體溫為 35.7°C,另一個人(從頂部第二個)為 35.8°C,而兩個人(從頂部第三個和第四個)為 35.9°C,等等。大多數人的溫度在 36.6°C 到 37.3°C 之間。

下面直方圖給出了相同資料的非常相似的圖形表示

130 個人體溫度的直方圖。

如果我們想用數字來概括資料,兩個重要的度量是平均值標準差 (SD)。對於此樣本資料,平均值為 36.805°C,SD 為 0.407°C。我們將在後面給出這兩個彙總統計量的更精確定義,但現在我們可以將它們視為資料的中心點(平均值)和圍繞其平均值的資料變異性的度量。在圖形上,平均值可以被認為是分佈的平衡點,其中直方圖的列的權重與其面積相同。對於這種資料,SD 可以解釋如下:如果我們取平均值並減去兩倍的 SD,或者加上兩倍的 SD,那麼大約 95% 的所有受試者將在此區間內具有體溫。

在初步觀察資料後,讓我們回到感興趣的問題:真實的平均體溫是否為 37°C?回答這個問題的一種方法是將問題顛倒過來,並從假設 37°C 實際上是真實的平均溫度開始。問題就變成了,從這樣一個假設的總體中抽取的樣本大小為 130 的樣本會是什麼樣子?這個問題可以用統計理論來回答,或者——在這個計算機化的時代——可以用基於隨機數生成的模擬樣本來回答。具體來說,讓我們假設這個假設的總體具有如下所示的體溫分佈

平均值為 37°C,SD 為 0.407°C 的假設總體的體溫分佈。

想象一下,我們接下來抽取 1,000 個樣本,每個樣本包含 130 個人。它們的平均值會是什麼樣子?這裡顯示了

從具有 37°C 真實平均值和 0.407°C SD 的假設總體中抽取的 1,000 個樣本的平均體溫直方圖。

我們再次看到一個近似鐘形的直方圖。樣本的平均值集中在 37°C 附近(就像假設的分佈一樣),但其分佈範圍比以前小得多。所有的一千個平均值都在 36.89°C 和 37.10°C 之間。這是我們能做的第一個重要觀察:平均值的變異性比單個觀測值的變異性更小(通常要小得多)。我們將在後面看到,存在一個描述這種變異性降低的明確公式。第二個重要觀察是,一千個樣本中沒有一個的平均值等於或小於 36.805°C(請記住,36.805°C 是對“真實”個體觀察到的實際平均值)。因此,如果總體中的真實平均體溫為 37°C,則極不可能得到 36.805°C 的樣本平均值。這就是所謂的統計顯著結果,這是技術術語,表示實際觀察到的資料與如果所調查的假設(真實平均體溫是否為 37°C?)為真時所預期的資料非常不同。因此,對我們問題的答案是,雖然我們不能完全排除真實的平均體溫為 37°C,但如果真實的平均值為 37°C,我們實際觀察到的結果極不可能出現。因此,我們得出結論,真實的平均體溫不為 37°C,即我們拒絕這個假設。

所以它不為 37°C,這實際上不是一個很有意義的發現。更有趣的問題是,根據我們在該樣本中觀察到的結果,真實的平均體溫可能是什麼。這通常用所謂的置信區間來回答。置信區間的基本原理是利用資料獲得儘可能好(即狹窄)的區間,在這個區間內,引數的真實值以給定的機率(通常為 95%)存在。計算區間的公式取決於資料的型別和取樣方式,但我們將把這留到後面的章節,現在集中討論它們的解釋。

因此,讓我們再次考慮上面描述的假設總體,其平均值為 37°C,SD 為 0.407°C。在下圖中,我們看到從這個假設分佈中抽取的 50 個隨機樣本的 95% 置信區間的計算結果。每個區間由一個點表示,表示特定樣本的平均值,而垂直線表示為樣本計算的置信區間。

基於從具有 37°C 平均值和 0.407°C SD 的假設正態分佈中抽取的 50 個樣本的 50 個 95% 置信區間。

請注意,在 50 個置信區間中,只有兩個沒有包含 37°C 的真實值,這是該假設總體的真實值。這與定義非常一致,即 95% 的此類區間應該包含真實值。換句話說,5% 的區間不應該包含真實值,對於 50 個樣本來說,這對應於 2.5 個區間不覆蓋真實值。

對於基於真實觀察結果的這個特定樣本,95% 置信區間為 (36.73°C; 36.88°C)。因此,關於平均人體體溫的結論是,對真實平均值的最佳估計是 36.81°C,我們有 95% 的把握相信真實值在 (36.73°C; 36.88°C) 範圍內。是陳述的後面部分,對於理解統計分析的價值至關重要:如果進行得當,它會產生對結果的不確定性的度量,或者用日常語言來說,已經測量了到真實值的可能距離,儘管其確切值未知。

華夏公益教科書