跳轉到內容

統計學基礎/顯著性

來自華夏公益教科書,開放的書籍,開放的世界

顯著性

[編輯 | 編輯原始碼]

在統計檢驗中,我們處理機率。以一種統計上可檢驗的方式提出我們的研究問題,就是問

如果零假設為真,我觀察到我收集到的資料的可能性有多大?

更技術地說

p 值表示如果零假設為真,則看到如此極端資料的機率

我們設定一個閾值,最常見的是 99% 或 95%,這意味著我們承認我們可能被誤導而拒絕零假設,分別為 1% 或 5% 的時間。P 必須低於此閾值才能拒絕零假設。也就是說,p 必須小於 0.01 或小於 0.05(99% 和 95% 的倒數,以小數表示)。

這個值,即p 值,被認為決定了檢驗結果是否顯著。如果結果顯著,則拒絕零假設。

選擇檢驗

[編輯 | 編輯原始碼]

人們經常發現上述第三步 - 選擇正確的檢驗 - 最困難,但如果我們知道我們想做什麼,並且對我們資料的性質有所瞭解,這並不難。下表涵蓋了大量常見情況。

問題 因變數的度量 兩個變數或組 兩個以上變數或組 引數 非引數
是否存在關聯? 名義 [1] 卡方檢驗
是否存在關聯? 序數 兩個 斯皮爾曼秩相關係數(並附帶強度指示)
是否存在關聯? 標量 兩個 皮爾遜相關係數(並附帶強度指示)
均值或中位數是否相同? 標量 兩個 學生 t 檢驗 曼-惠特尼 U 檢驗
均值或中位數是否相同? 標量 兩個以上 方差分析 (ANOVA) 克魯斯卡爾-沃利斯檢驗
我能否從一個預測另一個? 標量 兩個 兩個以上獨立 迴歸或多元迴歸

單尾還是雙尾?

[編輯 | 編輯原始碼]

當我們制定涉及引數或統計量值的比較的假設時,我們選擇以兩種方式之一提出問題。我們可以簡單地問值是否不同,或者我們可以問一個值是否小於(或大於)另一個。在第一種情況下,我們將使用雙尾檢驗來確定結果,而在第二種情況下,我們將使用單尾檢驗

  1. 這不是真的:可以測試兩個以上名義變數的關聯,但設計很複雜


1 導論

2 統計量

3 引數方法和非引數方法

4 描述性統計

5 推斷統計:假設檢驗

6 自由度

7 顯著性

8 關聯

9 比較組或變數

10 迴歸

華夏公益教科書