跳轉到內容

統計學/分佈/二項式

來自華夏公益教科書,自由的教科書,共建自由的世界

統計學


  1. 簡介
    1. 什麼是統計學?
    2. 現代統計學中的科目
    3. 為什麼我應該學習統計學? 0% developed
    4. 我需要知道些什麼才能學習統計學?
  2. 不同型別的資料
    1. 原始資料和次級資料
    2. 定量資料和定性資料
  3. 資料收集方法
    1. 實驗
    2. 抽樣調查
    3. 觀察研究
  4. 資料分析
    1. 資料清理
    2. 移動平均
  5. 彙總統計
    1. 集中趨勢的度量
      1. 平均數、中位數和眾數
      2. 幾何平均數
      3. 調和平均數
      4. 算術平均數、幾何平均數和調和平均數之間的關係
      5. 幾何中位數
    2. 離散程度的度量
      1. 資料的範圍
      2. 方差和標準差
      3. 四分位數和四分位數範圍
      4. 分位數
  6. 展示資料
    1. 條形圖
    2. 比較條形圖
    3. 直方圖
    4. 散點圖
    5. 箱線圖
    6. 餅圖
    7. 比較餅圖
    8. 象形圖
    9. 折線圖
    10. 頻率多邊形
  7. 機率
    1. 組合學
    2. 伯努利試驗
    3. 貝葉斯分析入門
  8. 分佈
    1. 離散分佈
      1. 均勻分佈
      2. 伯努利分佈
      3. 二項式分佈
      4. 泊松分佈
      5. 幾何分佈
      6. 負二項式分佈
      7. 超幾何分佈
    2. 連續分佈
      1. 均勻分佈
      2. 指數分佈
      3. 伽馬分佈
      4. 正態分佈
      5. 卡方分佈
      6. 學生t分佈
      7. F 分佈
      8. 貝塔分佈
      9. 威布林分佈
  9. 檢驗統計假設
    1. 統計檢驗的目的
    2. 使用的形式主義
    3. 不同型別的檢驗
    4. 單個均值的z檢驗
    5. 兩個均值的z檢驗
    6. 單個均值的t檢驗
    7. 兩個均值的t檢驗
    8. 配對t檢驗比較均值
    9. 單因素方差分析F檢驗
    10. 單個比例的z檢驗
    11. 兩個比例的z檢驗
    12. 在 Microsoft Excel 中檢驗比例 A 是否大於比例 B
    13. 斯皮爾曼秩相關係數
    14. 皮爾遜積矩相關係數
    15. 卡方檢驗
      1. 多個比例的卡方檢驗
      2. 列聯表的卡方檢驗
    16. 分佈的近似
  10. 點估計100% developed  as of 12:07, 28 March 2007 (UTC) (12:07, 28 March 2007 (UTC))
    1. 無偏性
    2. 優良性的度量
    3. UMVUE
    4. 完備性
    5. 充分性和最小充分性
    6. 輔助性
  11. 練習題
    1. 彙總統計練習題
    2. 資料展示練習題
    3. 分佈練習題
    4. 資料檢驗練習題
  12. 數值方法
    1. 基礎線性代數和格拉姆-施密特正交化
    2. 無約束最佳化
    3. 分位數迴歸
    4. 統計軟體的數值比較
    5. Excel 中的數值
    6. 統計學/數值方法/隨機數生成
  13. 時間序列分析
  14. 多元資料分析
    1. 主成分分析
    2. 度量資料的因素分析
    3. 序數資料的因素分析
    4. 典型相關分析
    5. 判別分析
  15. 特定資料集的分析
    1. 結核病分析
  16. 附錄
    1. 作者
    2. 詞彙表
    3. 索引
    4. 連結

編輯此框

伯努利分佈 詢問“這個單一事件會成功嗎?”這個問題時,二項式與“在給定的試驗次數中,會有多少次成功?”這個問題相關聯。一些用二項式分佈建模的示例問題是

  • 在十次拋擲中,這枚硬幣會有多少次正面朝上?
  • 在特定醫院特定日期出生的兒童中,有多少人是女孩?
  • 在特定教室中,有多少學生有綠色的眼睛?
  • 在一個蜂群中,有多少隻蚊子在噴灑殺蟲劑後會死亡?

伯努利分佈和二項式分佈之間的關係是直觀的:二項式分佈是由多個伯努利試驗組成的。我們進行 次重複實驗,其中成功的機率由引數 給出,並將成功的次數加起來。這個成功的次數由隨機變數 X 表示。X 的值介於 0 和 之間。

當一個隨機變數 X 服從引數為 的二項式分佈時,我們將其寫為 X ~ Bin(n,p) 或 X ~ B(n,p),其機率質量函式由以下公式給出

其中

要回顧階乘 (n!),請返回到本華夏公益教科書前面部分的 複習課程

一個例子

[編輯 | 編輯原始碼]

讓我們透過一個二項分佈的簡單示例來進行說明。 我們將使用一些非常小的數字,因為階乘可能很難計算。 我們將詢問五個隨機的人,他們是否相信其他星球上存在生命。 在這個例子中,我們假設我們知道 30% 的人認為這是真的。 我們想問這個問題:“有多少人會說他們相信外星生命?” 事實上,我們想比這更具體:**“恰好有 2 個人說他們相信外星生命的機率是多少?”**

我們知道需要代入方程的所有值。 被問的人數 n=5。 任何特定的人回答“是”的機率 p=0.3。 (請記住,我說 30% 的人相信其他星球上存在生命!)最後,我們詢問恰好有 2 個人回答“是”的機率,所以 k=2。 這將得出以下方程

因為

以下是 X 的所有可能值的機率。 你可以透過將上述方程中的 k=2 替換為 0 到 5 之間的全部值來獲得這些值。


k 的值 機率 f(k)
0 0.16807
1 0.36015
2 0.30870
3 0.13230
4 0.02835
5 0.00243

我們能從這些結果中瞭解到什麼? 首先,我們會看到只有一個人承認相信其他星球上存在生命的可能性略大一些。 沒有人相信的可能性很大(約 17%),只有 0.24%(每千人略高於 2 人)的可能性是所有五個人都會是信徒。

方程的解釋

[edit | edit source]

以上面的例子為例。 讓我們逐個考慮這五個人。

任何一個人相信外星生命存在的機率是 30%,也就是 0.3。 所以任何兩個人都相信外星生命存在的機率是 0.3 的平方。 同樣,任何一個人不相信外星生命存在的機率是 70%,也就是 0.7,所以任何三個人都不相信外星生命存在的機率是 0.7 的立方。

現在,對於五個人中有兩個人相信外星生命,必須滿足兩個條件:兩個人相信外星生命,而三個人不相信。 因此,五個人中有兩個人相信外星生命存在的機率似乎是 0.3 的平方(兩個信徒)乘以 0.7 的立方(三個不信徒),也就是 0.03087。

然而,在這樣做時,我們只考慮了第一個被選中的人是信徒的情況。 我們如何考慮第三和第五個人是信徒的情況,這也意味著五個人中有兩個信徒?

答案在於組合學。 考慮到五個人中前兩個人相信外星生命存在的機率是 0.03087,我們注意到從五個人中選出兩個人集的方法是 C(5,2),也就是 10,即,有十種方法可以考慮五個人中的兩個人是“前兩個人”。 這就是我們為什麼乘以 C(n,k) 的原因。 五個人中任何兩個人都是信徒的機率是十倍於 0.03087,也就是 0.3087。

均值可以推匯出如下。

現在令w=x-1m=n-1。我們可以看到m-w=n-x。現在我們可以將求和重寫為

現在我們可以看到,該求和是對二項式隨機變數分佈為Bin(m, p)的完整 pmf 的求和。它等於 1(並且可以使用二項式定理輕鬆驗證)。因此,我們有

方差

[edit | edit source]

我們使用以下公式推匯出方差

我們已經計算了上面的 E[X],所以現在我們將計算 E[X2],然後回到這個方差公式

我們可以使用我們在上面推匯出均值時獲得的經驗。我們使用mw 的相同定義。

第一個求和的形式與我們在均值(上面)中計算的相同。它加起來為mp。第二個求和為1。

將此結果代入方差表示式,以及均值(E(X) = np),我們得到

[編輯 | 編輯原始碼]
  1. 25
華夏公益教科書