統計/測試資料/目的
總的來說,統計檢驗的目的是確定某個假設在給定觀察資料的情況下是否極不可能。
對於這種檢驗,存在兩種常見的哲學方法,即顯著性檢驗(由費舍爾提出)和假設檢驗(由奈曼和皮爾遜提出)。
顯著性檢驗旨在量化反對特定假設為真的證據。我們可以將其視為指導研究的檢驗。我們相信某個陳述可能是真的,並希望弄清楚是否值得投入時間進行調查。因此,我們著眼於該陳述的反面。如果它很可能成立,那麼進一步研究似乎沒有意義。但是,如果它極不可能成立,那麼進一步研究就很有意義。
一個具體的例子可能是藥物測試。我們有很多藥物需要測試,但時間有限,因此我們假設一種藥物沒有任何積極效果,只有當這種假設不太可能成立時,我們才會進一步研究。
假設檢驗則著眼於支援特定假設為真的證據。我們可以將其視為指導決策的檢驗。我們需要儘快做出決策,並懷疑某個陳述是真實的。因此,我們檢視我們出錯的可能性,如果我們出錯的可能性足夠低,我們可以假設該陳述是真實的。通常,這種決策是最終的,不能更改。
統計學家經常忽略這些差異,並錯誤地將“顯著性檢驗”和“假設檢驗”這兩個術語視為可互換的。
資料分析師經常想知道兩組資料之間是否存在差異,以及該差異是否可能是由於隨機波動造成的,還是足夠罕見,以至於隨機波動很少造成這種差異。
特別是,我們經常希望瞭解平均值(或均值),或瞭解變異性(以方差或標準差來衡量)。
統計檢驗是透過首先做出一些假設(稱為零假設),然後確定在給定該假設的情況下,觀察到的資料是否不可能發生來進行的。如果在假設的零假設下觀察到資料的機率足夠小,那麼就拒絕零假設。
一個簡單的例子可能有助於理解。我們希望確定男性和女性的平均身高是否相同。我們選擇並測量了 20 名女性和 20 名男性。我們假設零假設,即男性和女性的平均身高之間沒有差異。然後,我們可以使用t 檢驗來確定在給定此假設的情況下,我們 40 個身高的樣本是否不可能發生。基本思想是假設身高服從正態分佈,並假設男性和女性的均值和標準差相同。然後我們計算 20 名男性的平均值和 20 名女性的平均值,我們還計算每個樣本的樣本標準差。然後,使用自由度為 40-2=38 的兩個均值 t 檢驗,我們可以確定男性樣本和女性樣本之間身高的差異是否足夠大,以使其不可能來自同一個正態總體。