統計學基礎/顯著性
外觀
< 統計學基礎
在統計檢驗中,我們處理機率。以一種統計上可檢驗的方式提出我們的研究問題,就是問
- 如果零假設為真,我觀察到我收集到的資料的可能性有多大?
更技術地說
- p 值表示如果零假設為真,則看到如此極端資料的機率
我們設定一個閾值,最常見的是 99% 或 95%,這意味著我們承認我們可能被誤導而拒絕零假設,分別為 1% 或 5% 的時間。P 必須低於此閾值才能拒絕零假設。也就是說,p 必須小於 0.01 或小於 0.05(99% 和 95% 的倒數,以小數表示)。
這個值,即p 值,被認為決定了檢驗結果是否顯著。如果結果顯著,則拒絕零假設。
人們經常發現上述第三步 - 選擇正確的檢驗 - 最困難,但如果我們知道我們想做什麼,並且對我們資料的性質有所瞭解,這並不難。下表涵蓋了大量常見情況。
| 問題 | 因變數的度量 | 兩個變數或組 | 兩個以上變數或組 | 引數 | 非引數 |
|---|---|---|---|---|---|
| 是否存在關聯? | 名義 | 是 | [1] | 卡方檢驗 | |
| 是否存在關聯? | 序數 | 兩個 | 斯皮爾曼秩相關係數(並附帶強度指示) | ||
| 是否存在關聯? | 標量 | 兩個 | 皮爾遜相關係數(並附帶強度指示) | ||
| 均值或中位數是否相同? | 標量 | 兩個 | 學生 t 檢驗 | 曼-惠特尼 U 檢驗 | |
| 均值或中位數是否相同? | 標量 | 兩個以上 | 方差分析 (ANOVA) | 克魯斯卡爾-沃利斯檢驗 | |
| 我能否從一個預測另一個? | 標量 | 兩個 | 兩個以上獨立 | 迴歸或多元迴歸 |
當我們制定涉及引數或統計量值的比較的假設時,我們選擇以兩種方式之一提出問題。我們可以簡單地問值是否不同,或者我們可以問一個值是否小於(或大於)另一個。在第一種情況下,我們將使用雙尾檢驗來確定結果,而在第二種情況下,我們將使用單尾檢驗。
- ↑ 這不是真的:可以測試兩個以上名義變數的關聯,但設計很複雜