跳轉到內容

統計/分佈/泊松

來自華夏公益教科書,開放的書籍,開放的世界

泊松分佈

[編輯 | 編輯原始碼]
泊松
機率質量函式
Plot of the Poisson PMF
橫軸是索引 *k*,即事件發生的次數。該函式僅在 *k* 的整數值上定義。連線線僅作為視覺參考。
累積分佈函式
Plot of the Poisson CDF
橫軸是索引 *k*,即事件發生的次數。CDF 在 *k* 的整數值處不連續,而在其他地方則保持平坦,因為泊松分佈的變數僅取整數值。
符號
引數 λ > 0 (實數)
支援 k ∈ { 0, 1, 2, 3, ... }
PMF
CDF --或者--

(對於 其中 不完全伽瑪函式 並且 地板函式)

均值
中位數
眾數
方差
偏度
峰度

(對於較大的)
                   

矩生成函式 (MGF)
特徵函式 (CF)
機率生成函式 (PGF)

任何法語使用者都會注意到 "Poisson" 的意思是 "魚",但這與這種分佈並沒有什麼關係。它實際上非常簡單。這個名字來自數學家 西莫恩·德尼·泊松 (1781-1840)。

泊松分佈與 二項分佈 非常相似。我們正在考察事件發生的次數。區別很細微。二項分佈考察的是在固定次數的試驗中我們記錄了多少次成功,而泊松分佈測量的是在一段連續的空間或時間內,離散事件發生的次數。沒有一個 "總" 值 n。與之前的部分一樣,讓我們來考察幾個可能具有泊松性質的實驗或問題。

  • 我回家路上會遇到多少便士?
  • 今天醫院會出生多少個孩子?
  • 今天噴了殺蟲劑後,你被蚊子叮了多少次?
  • 我在播放了一則特別令人反感的政治廣告後,接到了多少個憤怒的電話?
  • 播放新的電視廣告後,我會賣出多少產品?
  • 每小時有多少人會穿過警戒線進入我的商店?
  • 今年將提交多少份外星人綁架報告?
  • 每售出 100 米繩子會有多少個缺陷?

這個分佈有點不同的是,用來計數事件數量的隨機變數 X 可以取任何非負整數。換句話說,我回家後可能會發現街上沒有便士。我也可能會發現一枚便士。也有可能(雖然不太可能,除非附近發生裝甲車爆炸)我發現 10 個或 100 個或 10,000 個便士。

我們沒有像伯努利分佈和二項分佈中的引數 p 那樣代表一個組成機率,而是有一個引數 "lambda" 或 λ,它代表我們在實驗中 "平均或預期" 發生的事件數量。泊松分佈的機率質量函式由下式給出:

.

一個例子

[編輯 | 編輯原始碼]

我們經營一家餐廳,我們的招牌菜(非常昂貴)平均每天被點 4 次。明天這道菜被點 3 次的機率是多少?如果我們只有準備 3 道菜的食材,那麼這道菜賣光的機率是多少,我們需要拒絕一些訂單?

如果我們在上面的等式中設定 k=3,就可以得到這道菜恰好被點 3 次的機率。記住我們已經確定平均每天賣出 4 道菜,所以 λ=4。

以下是 k=0..6 所有值的機率表

k 的值 機率 f(k)
0 0.0183
1 0.0733
2 0.1465
3 0.1954
4 0.1954
5 0.1563
6 0.1042

現在最大的問題是:我們明天結束營業前會賣光食物嗎?換句話說,我們想知道隨機變數 X 是否大於 3。為了計算這一點,我們需要將 X=4、X=5、X=6 ... 一直加到無窮大!但是等等,有一個更好的方法!

賣光食物的機率 P(X>3) 等於 1 減去我們沒有賣光食物的機率,或者 1-P(X≤3)。所以如果我們把我們賣出零道菜、一道菜、兩道菜和三道菜的機率加起來,然後從 1 中減去,我們就得到了答案。所以,

1 - P(X≤3) = 1 - ( P(X=0) + P(X=1) + P(X=2) + P(X=3) ) = 1 - 0.4335 = 0.5665

換句話說,我們有 56.65% 的機會賣光我們美味的招牌菜。我想我們只能祈禱了!

均值

[edit | edit source]

我們按以下方式計算平均值

請記住

方差

[edit | edit source]

我們使用以下公式推匯出方差

我們已經計算了上面的 E[X],所以現在我們將計算 E[X2],然後回到這個方差公式。

....用 代替

第一個求和是 E[X]=λ,第二個我們也在上面計算過是 1。

回到方差公式,我們發現

[edit | edit source]
華夏公益教科書