費希爾精確檢驗 (2x2)
- 在較小的醫學研究中非常常見
- 適用於二元資料
- 評估兩個二元分類之間的關聯
- 特徵
- "組 1" 與 "組 2"
- 例如:男性/女性、給予治療/未給予治療、治療型別 1/治療型別 2、高劑量/低劑量等。
- 結果
- "成功" 與 "失敗"
- 例如:活著/死亡、響應/無響應、復發/無復發等。
- 這定義了一個 2x2 矩陣
費希爾的 2x2 矩陣
| |
結果 1 |
結果 2 |
| 組 1 |
|
|
| 組 2 |
|
|
|
|
|
- 用於小樣本量(通常少於 50),因為計算能力有限。有關近似值的更多資訊,請參見Χ2 檢驗
- 檢驗的假設 (H0) 是兩個分類之間沒有關聯
- 費希爾檢驗確定該假設與資料的吻合程度
- 組 1 與結果 1(例如,男性 - 生存)相關的機率為 p1
- 組 2 與結果 2(例如,女性 - 生存)相關的機率為 p2
- 檢驗假設 (H0) 是沒有相關性,並且 p1 = p2
- 因此,總體 "成功" 率(結果 1)p0 = p1 = p2,可以計算為(組 1 結果 1 + 組 2 結果 1)/(總體)。
- 觀察:我們觀察到研究中給定的結果 1 的總數
- 問題是,結果 1 在組 1 和組 2 之間的劃分是否滿足 p1 = p2,或者它們是否劃分成不可能滿足 p1 = p2?
- 為了客觀地評估這個問題,我們建立了表格,顯示了在給定組 1 和組 2 中固定數量的案例,以及結果 1 和結果 2 中固定數量的事件的情況下,我們可能看到的所有可能結果。
- 檢驗統計量 (T) 是組 1 中結果 1("成功")的數量。
- 鑑於組 1 和組 2 中的案例數量是已知的,並且結果 1 和結果 2 事件的數量是已知的,因此知道 T 就能確定矩陣中的所有其他點。
費希爾檢驗
| |
結果 1 |
結果 2 |
總計 |
| 組 1 |
T |
R1-T |
R1 |
| 組 2 |
C1-T |
C2+T-R1 |
R2 |
| 總計 |
C1 |
C2 |
N |
- 然後,我們評估每個可能結果(包括實際觀察到的結果)在隨機抽樣中由於偶然發生而出現的機率
- 二項式係數計算用於找到表格 T(t 的範圍)在隨機抽樣中偶然出現的機率
- 但是,由於這些計算量很大,通常使用統計表或軟體來評估 T 的機率
- 實際結果的機率加上由於偶然隨機抽樣而發生的更不可能結果的機率定義了顯著性水平 (p)
- 如果這些結果的機率小於 5%(p<0.05),通常會拒絕關於兩組之間沒有差異的檢驗假設
- 假設
- 給定組中每個成員的結果機率相同;它不會因成員而異。隨機抽樣確保了這一點
- 一個成員的結果不會影響另一個成員的結果
- 改編自PMID 6092550,如使用和理解醫學統計中所示。
- 在我們上面的例子中,觀察到 4 次復發。問題是,複發率是否與治療型別(大區域放療與小區域放療)相關?
- 如果 H0 假設為真,並且兩個失敗率可比,並且也與整個接受放療人群的失敗率可比,那麼 p0 = 4/259 = 0.015
- 因此,在小區域放療組中觀察到的預期失敗次數為 23 個病人 x 0.015 = 0.4 次失敗。
- 但是,觀察到 2 次失敗。這可能是由於偶然因素,還是不是?
- 在隨機抽樣中觀察到 4 次失敗有 5 種可能性(可能性 2 是實際觀察到的結果)。
可能性 0
| |
復發 |
無復發 |
| 小區域放療 |
0 |
23
|
| 大區域放療 |
4 |
232
|
|
|
可能性 1
| |
復發 |
無復發 |
| 小區域放療 |
1 |
22
|
| 大區域放療 |
3 |
233
|
|
|
可能性 2
| |
復發 |
無復發 |
| 小區域放療 |
2 |
21
|
| 大區域放療 |
2 |
232
|
|
|
可能性 3
| |
復發 |
無復發 |
| 小區域放療 |
3 |
20
|
| 大區域放療 |
1 |
235
|
|
|
可能性 4
| |
復發 |
無復發 |
| 小區域放療 |
4 |
19
|
| 大區域放療 |
0 |
236
|
|
複發率
| |
可能性 0 |
可能性 1 |
可能性 2 (觀察到的) |
可能性 3 |
可能性 4 |
(預期的)
|
| 小區域放療 |
0.000 |
0.044 |
0.087 |
0.130 |
0.174 |
0.015
|
- 然後,我們需要計算每個可能性發生的機率(通常由專業統計學家完成,有關更多詳細資訊,請參見下文)。
發生的機率
| |
可能性 0 |
可能性 1 |
可能性 2 (觀察到的) |
可能性 3 |
可能性 4 |
總計
|
| 小區域放療 |
0.687 |
0.271 |
0.039 |
0.002 |
0.0001 |
1.000
|
- 我們最初的假設是,小區域放療的失敗機率與大區域放療的失敗機率相同,與接受放療的整個潛在人群的失敗機率相同。可能性 0(68.7%)和可能性 1(27.1%)與該假設相當一致。
- 實際觀察結果(可能性 2)作為隨機抽樣過程的結果而發生的機率為 0.039(3.9%),這並不合理。可能性 3-5 比實際觀察到的結果更不可能合理(0.2%,0.01%)。
- 顯著性水平是觀察到的結果機率之和(3.9%)以及更不可能的可能性機率之和(0.2%,0.01%)= 4.11%;表示為 p=0.04
- 在此示例中,拒絕了關於兩組在兩個結果方面沒有差異的假設。結論:小區域放療導致的失敗明顯更多。