跳轉到內容

統計學/測試資料/測試型別

來自華夏公益教科書,為開放世界提供開放書籍

統計檢驗始終是關於所關注總體(分佈)的一個或多個引數。適當的檢驗取決於關於此(這些)引數的零假設和備擇假設的型別以及從樣本中獲得的資訊。

據推測,英國兒童最近體重增加。因此,我們假設兒童(例如 12 歲)的體重 X 的總體平均數 μ 是所關注的引數。在最近的過去,這組兒童的平均體重為 45 公斤。因此,零假設(無變化)為

.

由於我們懷疑體重會增加,因此備擇假設為

.

隨機抽取的 100 個孩子,平均體重為 47 公斤,標準差為 8 公斤。

由於可以合理地假設體重呈正態分佈,因此適當的檢驗將是 t 檢驗,檢驗統計量為

.

在零假設下,T 將服從自由度為 99 的學生 t 分佈,這意味著它近似於標準正態分佈。

當 T 的值較大時,我們將拒絕零假設。對於此樣本,T 的值為

.

這是一個很大的值嗎?這部分取決於我們的要求。觀察值 t 的 p 值為

,

其中 Z 代表標準正態分佈的隨機變數。

如果我們不太苛刻,這個值足夠小,所以我們有理由拒絕零假設並認為我們的推測是正確的。

現在假設我們丟失了單個數據,但仍然知道樣本中的最大體重為 68 公斤。那麼我們就不能使用 t 檢驗,而必須使用基於統計量 max(X) 的檢驗。

也可能我們對體重分佈的假設存在疑問。為了避免討論,我們可以使用無分佈檢驗而不是 t 檢驗。

統計檢驗從一個假設開始;該假設的形式決定了可以使用的檢驗型別。在某些情況下,只有一種是合適的;而在另一些情況下,我們可能有一些選擇。

例如:如果假設涉及單個總體平均值 () 的值,那麼就表明需要進行單樣本均值檢驗。是否應該使用 z 檢驗或 t 檢驗取決於其他因素(每個檢驗都有其自身的條件要求)。

對每種檢驗型別適用條件的完整列表可能超出了本工作的範圍;有關每種檢驗的適用條件和要求的更多資訊,請參閱有關各種檢驗型別的部分。

華夏公益教科書