統計/測試資料/z檢驗2
零假設應該是關於兩個總體均值差異的假設(注意,在每個總體中必須測量相同的定量變數)。資料應包含兩個定量資料的樣本(每個總體一個)。這些樣本必須獨立地從彼此獲得。
樣本必須來自具有已知標準差(或方差)的總體。此外,每個總體中測量的變數(一般表示為 x1 和 x2)應具有正態分佈。
注意,如果總體中變數的分佈是非正態的(或未知的),則仍然可以使用雙樣本 z 檢驗來獲得近似結果,前提是組合樣本量(樣本量之和)足夠大。歷史上,組合樣本量至少為 30 被認為足夠大;現實(當然)要複雜得多,但這個經驗法則仍在許多教科書中使用。
- 零假設
- H0 : μ1 - μ2 = δ
其中 δ 是零假設下期望值之間的假定差異。
- 備擇假設
- H0 : μ1 - μ2 < δ
- H0 : μ1 - μ2 > δ
- H0 : μ1 - μ2 ≠ δ
有關零假設和備擇假設的更多資訊,請參見單均值 z 檢驗頁面。
- 檢驗統計量
通常,零假設是總體均值相等;在這種情況下,公式簡化為
過去,如果可以假設兩個總體的方差(以及標準差)相等,則計算更簡單。此過程稱為合併,許多教科書仍然使用它,儘管它正在逐漸被淘汰(因為計算機和計算器幾乎消除了所有計算問題)。
- 顯著性(p 值)
使用備擇假設計算觀察到 z 值(來自標準正態分佈)的機率,以指示在機率密度函式下方計算面積的方向。這是獲得的顯著性或 p 值。
注意,一些(較舊的)方法首先選擇一個顯著性水平,然後將其轉換為 z 值。這在計算機和圖形計算器出現之前的時代更有意義(也更容易!)。
- 決定
獲得的顯著性表示在零假設為真的情況下,獲得與我們的檢驗統計量一樣極端或更極端的檢驗統計量的機率。
如果獲得的顯著性(p 值)足夠低,則表明我們的檢驗統計量是不尋常的(罕見的)——我們通常將其視為零假設有誤的證據。在這種情況下,我們拒絕零假設。
如果 p 值很大,則表明檢驗統計量是通常的(常見的)——我們將此視為缺乏反對零假設的證據。在這種情況下,我們無法拒絕零假設。
通常使用 5% 作為常見與不尋常之間的分界線;再次,現實更復雜。
美國大學和學院按提供的最高學位分類。IIA 類機構提供碩士學位,IIB 類機構提供學士學位。一位正在尋找新職位的教授想知道 IIA 和 IIB 類機構之間的薪資差異是否真的有意義。
他發現,隨機抽取的 200 家 IIA 類機構的平均工資(正教授)為 $54,218.00,標準差為 $8,450。隨機抽取的 200 家 IIB 類機構的平均工資(正教授)為 $46,550.00,標準差為 $9,500(假設樣本標準差實際上是總體標準差)。
這些資料表明 IIA 類機構的工資明顯更高嗎?
零假設是沒有差異;因此
- H0 : μA = μB
(其中 μA 是 IIA 類機構的真實正教授平均工資,μB 是 IIB 類機構的平均工資)
他正在尋找 IIA 類機構平均工資更高的證據;因此備擇假設是
- H1 : μA > μB
由於假設涉及來自獨立樣本的均值(我們假設這些是獨立樣本),因此建議進行雙樣本檢驗。樣本量很大,並且已知標準差(假設?),因此雙樣本 z 檢驗是合適的。
現在我們找到標準正態分佈中z=8.5292右側的面積。這可以透過表格或軟體完成,我得到0。
如果零假設成立,並且兩種機構型別之間的薪資沒有差異,那麼獲得樣本的機率,其中IIA機構的平均值至少比IIB機構的平均值高出7668美元,實際上為零。這種情況發生的頻率太低,無法歸因於偶然變異;這似乎很不尋常。我拒絕零假設(在任何合理的顯著性水平上!)。
看起來IIA學校的薪資明顯高於IIB學校。
示例2
[edit | edit source]一名學生在微積分考試中取得了65分,考試平均分為50分,標準差為10分;她在歷史考試中取得了30分,考試平均分為25分,標準差為5分。比較她在兩場考試中的相對位置?