跳轉到內容

統計學/統計假設檢驗

來自華夏公益教科書,開放的書籍,開放的世界
Two examples of how the means of two distributions may be different, leading to two different statistical hypotheses
相等分佈,但均值不同。

對於許多不同型別的資料,有許多不同的檢驗方法。入門方法是瞭解您的資料型別。變數是定量的還是定性的?某些檢驗方法適合於某些型別的資料,具體取決於資料的大小、分佈或尺度。此外,瞭解資料樣本如何不同也很重要。定量資料的三個主要特徵是:集中趨勢、離散程度和形狀。

當大多數人“檢驗”定量資料時,他們往往會進行集中趨勢檢驗。為什麼?假設您有兩組資料,並且您想檢視它們是否彼此不同。檢驗此方法的一種方法是檢驗其集中趨勢(例如均值)是否不同。

想象兩個對稱的鐘形曲線,在每個曲線的中間畫一條垂直線,如圖所示。如果一個樣本與另一個樣本非常不同(值明顯更高等),則均值通常會不同。因此,在檢驗兩個樣本是否不同時,通常會比較兩個均值。

也可以比較兩個中位數(集中趨勢的另一個度量)。或者,也許有人希望檢驗兩個樣本,以檢視它們是否具有相同的離散程度或變異性。由於集中趨勢、離散程度等的統計量遵循不同的分佈,因此必須遵循和使用不同的檢驗程式。

最後,大多數人將假設檢驗的結果總結為一個特定值 - p 值。如果 p 值小於顯著性水平(通常 ,但在其他科學領域(例如醫學)中更低),則您拒絕原假設,但這並不意味著您接受備擇假設。p 值本質上是獲得至少與觀察到的檢驗統計量一樣極端的檢驗統計量的機率。如果 p 值大於顯著性水平,則您無法拒絕原假設,但這並不意味著原假設是正確的。

華夏公益教科書