跳轉至內容

放射腫瘤學/醫學統計/卡方檢驗

來自華夏公益教科書,開放的書籍,開放的世界


Χ2 (卡方)


  • 用於比較兩種分類方案,每種方案可能有多個類別
  • 目的是確定觀察到的資料是否(或不)與假設 H0 一致:不同組中結果的機率相同
  • 用於近似 費舍爾精確檢驗 (2x2) 用於大量資料
    • 估計的準確性取決於每個單元格中的總觀察次數
    • 預期觀察值(根據實際觀察值計算;見下文)在每個單元格中至少應為 5
  • 用於擴充套件 費舍爾精確檢驗 用於比較具有 >2 個類別的分類方案

Χ2 用於 2x2 表格

[編輯 | 編輯原始碼]
  • 用於表格,這些表格對於 費舍爾精確檢驗 太大
  • 該過程是並行的;請參閱該頁面以瞭解初始設定的詳細資訊
2x2 表格
  結果 1 結果 2 總數
組 1 O11 O12 R1
組 2 O21 O22 R2
總數 C1 C2 N
 
2x2 表格示例
  籃球 壘球/棒球 總數
男生 12 14.7 27
女生 13 15.3 28
總數 25 30 55
  • 首先假設 H0 為真,並且 p0 = p1 = p2
  • 根據觀察到的總數計算預期的 2x2 表格
    • 預期總體“成功率”為 p0 = C1 / N
    • 使用 p0 和觀察到的組 1/2、結果 1/2 數,計算預期的 2x2 表格
  • 透過計算檢驗統計量 T 將預期表格與觀察到的表格進行比較
  • 計算 T 的一種方法是評估每個單元格中觀察值和預期值之間的比例差異,然後將它們全部加起來
    • T = ((O11-E11)2/E12) + ((O12-E12)2/E12) + ((O21-E21)2/E21) + ((O22-E22)2/E22)
  • 經過一些巧妙的數學運算,可以從原始觀察到的表格中更簡單地計算出來
    • T = N * (|O11 * O22 - O12 * O21| - 1/2*N)2 / R1 * R2 * C1 * C2
  • 由於 T 是從觀察值與預期值之差推匯出來的,因此 T 越大,表格的差異就越大,H0 的可能性就越小
  • 為了計算顯著性水平,我們需要評估觀察到的表格是由於隨機抽樣造成的可能性,這與 T 的大小有關。我們還需要評估所有可能觀察到的其他表格的可能性(同樣,與費舍爾檢驗相同)
  • 當 H0 為真時,T 的機率分佈近似於 Χ2 函式的機率分佈
  • 因此,我們可以透過在 T 水平上評估 Χ2 函式(透過在表格中查詢它)來近似地確定觀察到的 T 的機率
  • 由於這些是近似值,因此該表通常給出臨界值
Χ2 用於 2x2 表格
機率 0.25 0.10 0.05 0.01 0.005 0.001
T 1.323 2.706 3.841 6.635 7.879 10.83
  • 這是觀察到的結果(以及任何可能的結果比這不太可能)僅僅是由於隨機抽樣而發生的機率

Χ2 用於 2x2 表格示例

[編輯 | 編輯原始碼]
觀察到的
  移植物排斥 植入
低細胞劑量 17 19
高細胞劑量 4 28
 
預期 (計算)
  移植物排斥 植入
低細胞劑量 11 25
高細胞劑量 10 22
  • T = 8.01
  • 從上面的 Χ2 表格中,p 在 0.005 和 0.001 之間。
  • 因此我們可以得出結論 p < 0.005 並且高細胞劑量與植入密切相關
華夏公益教科書