跳轉到內容

統計/測試資料/z檢驗

來自華夏公益教科書,開放的書籍,開放的世界

零假設應該是關於總體均值的假設。資料應該由來自總體的單個定量資料樣本組成。

樣本應該來自已知標準差(或方差)的總體。此外,測量的變數(通常列為 樣本統計量)應該服從正態分佈。

請注意,如果總體中變數的分佈是非正態的(或未知的),那麼 z 檢驗仍然可以用於獲得近似結果,前提是樣本量足夠大。歷史上,樣本量至少為 30 被認為足夠大;現實(當然)要複雜得多,但這個經驗法則仍在許多教科書中使用。

如果總體標準差未知,則通常不適合使用 z 檢驗。但是,當樣本量很大時,樣本標準差可以用作總體標準差的估計,並且 z 檢驗可以提供近似結果。

術語定義

[編輯 | 編輯原始碼]
= 總體均值
= 總體標準差
= 樣本均值
= 樣本大小
  • 零假設

這是一個關於無變化無影響的陳述;通常,我們正在尋找該陳述不再正確的證據。

H0 : μ = μ0
  • 備擇假設

這是一個關於不等式的陳述;我們正在尋找該陳述正確的證據。

H1 : μ < μ0
H1 : μ > μ0
H1 : μ ≠ μ0
  • 檢驗統計量
  • 顯著性(p 值)

使用備擇假設計算觀察 z 值(來自標準正態分佈)的機率,以指示在機率密度函式下計算面積的方向。這是獲得的顯著性,即 p 值。

請注意,一些(較舊的)方法首先選擇一個顯著性水平,然後將其轉換為 z 值。在沒有計算機和圖形計算器的時代,這樣做更有意義(也更容易!)。

  • 決策

獲得的顯著性表示如果零假設為真,則獲得與我們的檢驗統計量一樣極端或更極端的檢驗統計量的機率。

如果獲得的顯著性(p 值)足夠低,則表明我們的檢驗統計量不尋常(罕見)——我們通常將此作為零假設有誤的證據。在這種情況下,我們拒絕零假設

如果 p 值很大,則表明檢驗統計量很常見——我們將其視為缺乏反對零假設的證據。在這種情況下,我們未能拒絕零假設

通常將 5% 用作常見和不常見之間的分界線;同樣,現實更復雜。如果錯誤的後果會導致一個可能傷害或殺死人或造成重大經濟損失的決定,有時必須選擇更低的確定性水平。我們更有可能容忍一種殺死患有絕症的患者 5% 但治癒 95% 患者的藥物,但我們幾乎不能容忍一種使 5% 的使用者的外貌發生改變的化妝品。

孩子們是否高於平均水平?

[編輯 | 編輯原始碼]

某項數學能力測試的平均分為 μ = 50,標準差為 σ = 10。一位業餘研究人員認為他所在地區的學生比平均水平更聰明,並希望測試他的理論。

研究人員獲得了來自他所在地區學生的 45 個分數的隨機樣本。該樣本的平均分為 52。

研究人員是否有證據支援他的信念?

零假設是沒有區別,他所在地區的學生與總體中的學生沒有區別;因此,

H0 : μ = 50

(其中 μ 表示他所在地區學生的平均分數)

他正在尋找證據表明他所在地區的學生高於平均水平;因此,備擇假設是

H1 : μ > 50

由於假設涉及單個總體均值,因此指示使用 z 檢驗。樣本量相當大(大於 30),並且已知標準差,因此 z 檢驗是合適的。

現在,我們找到正態分佈曲線下z=1.3416右側的面積(因為備擇假設是在右側)。這可以透過查表或軟體來完成——我得到了0.0899的值。

如果原假設為真(這些學生與普通人群沒有區別),那麼得到樣本均值為52或更高的機率為8.99%。這種情況相當常見(使用5%規則),所以看起來並不奇怪。我無法拒絕原假設(在5%水平)。

看來證據 *並不* 支援研究人員的觀點。

機器工作正常嗎?

[edit | edit source]

蘇是飲料生產工廠的質量控制負責人。目前,她正在檢查一臺機器的操作情況,該機器應該將355毫升的液體注入鋁罐中。如果機器注入的液體過少,則當地監管機構可能會對公司處以罰款。如果機器注入的液體過多,則公司可能會損失資金。出於這些原因,蘇正在尋找機器注入量與355毫升存在差異的任何證據。

在調查期間,蘇獲得了一個10個罐頭的隨機樣本,並測量了以下體積

355.02 355.47 353.01 355.93 356.66 355.98 353.74 354.96 353.81 355.79

機器的規格聲稱注入的液體量服從正態分佈,其均值為μ=355毫升,標準差為σ=0.05毫升。

資料是否表明機器工作正常?

原假設是機器按照其規格進行操作;因此

H0 : μ = 355

(其中μ是機器注入的液體平均體積)

蘇正在尋找 *任何* 差異的證據;因此,備擇假設是

H1 : μ ≠ 355

由於假設涉及單個總體均值,因此需要進行z檢驗。總體服從正態分佈,並且已知標準差,因此z檢驗是合適的。

為了計算檢驗統計量(z),我們必須首先從資料中找到樣本均值。使用計算器或計算機來計算 .

p值的計算會稍微不同。如果我們只找到正態曲線下z=2.34 *上方* 的面積,那麼我們找到了得到樣本均值為355.037或 *更高* 的機率——那麼得到較低值的機率呢?

如果備擇假設使用≠,則p值是透過 *將尾部面積加倍* 來找到的——在本例中,我們將z=2.34上方的面積加倍。

z=2.34上方的面積為0.0096;因此,本檢驗的p值為0.0192。

如果機器注入的是355毫升,那麼得到樣本均值離355毫升如此遠(0.037毫升)或更遠的機率為0.0096,即0.96%。這是相當罕見的;我將拒絕原假設。

看來機器工作不正常。

注意:由於備擇假設是≠,因此我們不能得出機器注入的液體 *超過* 355毫升的結論——我們只能說注入量與355毫升 *不同*。

華夏公益教科書