計算機系統工程/泊松過程
- 以西美昂-德尼·泊松 (1781–1840) 命名
- 描述一個“完全隨機的過程”
示例 - 放射性物質的衰變
- 如果事件是由許多獨立的動作引起的,通常效果很好(通常 4 或 5 次可以給出很好的近似值)
事件之間的平均時間
區間內事件的平均數量
無記憶性(非常重要)
s 內沒有事件;找到下一個事件在 t 內發生的機率
記住:不重疊的時間間隔是獨立的!
一個時間間隔就像任何其他時間間隔一樣,這會導致悖論。如果我們要隨機選擇一個點,則該點更有可能落在較大的間隔內,而不是落在較小的間隔內(較大的間隔在直線上佔據更多空間)。
對於泊松到達,如果我們隨機選擇一個區間,它將(平均)是平均區間的兩倍。
事件均勻分佈
對於泊松過程,事件之間的時間服從指數分佈。其密度函式為透過分部積分可以找到事件之間的預期時間
事件間隔時間的方差可以類似地計算。它是
因此,其標準差為
其變異係數為
coefficient of variation =
再次對小 h 進行泰勒級數展開得到
h 內發生超過 1 個事件的機率為
這證明了泊松過程的性質 (ii)、(iii) 和 (iv) 的等價性。
指數事件間隔時間分佈意味著區間內事件數量服從泊松分佈,這可以透過與證明 (iv) 蘊含 (ii) 幾乎相同的方式直接證明。
考慮一個區間 T
再次
T 中恰好發生一個事件的機率是在所有可能的 y 值下,事件在 y 處發生且在區間 (T—y) 中沒有事件發生的總機率。
T 中恰好發生兩個事件的機率是在所有可能的 y 值下,事件在 y 處發生且在區間 (T—y) 中發生一個事件的總機率。
一般來說
.
長度為 T 的區間內發生的事件的預期數量為
結果並不意外,但證實了泊松過程(或等效地指數分佈)的引數是平均事件率。
假設自上次事件發生以來已經過去了時間 s,下一個事件發生之前的時間大於 t 的機率是多少?這與詢問事件之間的時間 X 大於 s + t 的機率相同,前提是它大於 s。
因此,代入得到
這是泊松過程眾所周知的無記憶性。直到下一個事件的時間分佈與自上次事件發生以來已經過去了多少時間無關,並且直到下一個事件的平均時間與平均事件間隔時間相同。此屬性也是泊松過程完全隨機性的直接結果;區間 t 中發生的事情與區間 s 中發生的事情無關。
泊松過程的無記憶性會導致一個有趣的悖論。假設我們有一個泊松過程並選擇一個任意時間 t’。直到下一個事件的平均時間為,並且向後看,自上次事件以來的平均時間也為。因此,這兩個事件之間的平均時間必須為。但平均事件間隔時間為。可以透過注意到時間 t’更有可能落在較大的事件間隔內而不是較小的事件間隔內來解決該悖論。事實上,包含 t’ 的事件間隔的預期大小將是平均值的的兩倍。
為了說明此悖論的結果,假設計算機系統中對磁碟 I/O 操作的請求呈指數分佈。我們透過讀取時鐘並在每次讀取或寫入後將其重置為零來測量請求之間的時間。如果我們嘗試透過選擇某個任意時間 t’,然後在下一個 I/O 操作時讀取時鐘來對該過程進行取樣,則樣本的平均值將是 I/O 操作之間平均時間的兩倍。為了正確地對該過程進行取樣,我們需要選擇一個任意時間,然後對下一個兩個 I/O 操作之間的時間進行取樣。
如果我們有一個長度為 t 的區間並且在 t 期間發生了一個事件,那麼該事件發生在長度為 s 的子區間內的機率是多少?
這與詢問(其中 X 是從區間開始到事件發生的時間)在 t 期間恰好發生一個事件的條件下的機率相同:。我們注意到,如果則在 s 期間發生一個事件,而在區間 (t-s) 期間沒有事件發生。因此
現在,由於兩個不重疊區間中發生的事情是獨立的,。代入
泊松分佈得到
該事件發生在子區間 s 內的機率與區間 s 的大小成正比。也就是說,該事件在區間 t 內均勻分佈。其分佈和密度函式為
其中 t 是區間的長度。如下所示。
假設我們有兩個獨立的泊松過程,我們將其指定為過程 1 和過程 2,並令
= the number of events in process 1 during an interval of length T = the number of events in process 2 during the same interval = the average event rate for process 1 = the average event rate for process 2
這兩個過程的疊加是具有過程 1 和過程 2 的所有事件的過程。如下所示。
疊加過程中事件的機率分佈是什麼, ?
如果 r 是第一個過程中 T 期間的事件數量,則只有當過程 2 具有 k-r 個事件時(對 k 個事件的條件),疊加過程才能具有 k 個事件。這些過程是獨立的。因此,對於每個 r 值,r=0,1...k
因此,疊加過程中出現 k 個事件的總機率是這些機率的總和,乘以過程 1 中出現 r 個事件的機率。這稱為全機率公式。
代入泊松分佈得到
最後一項只是以下表達式的二項式展開
因此
但這僅僅是引數為 的泊松分佈。此外,由於過程 1 和過程 2 是獨立的,並且每個過程在不重疊時間間隔內的事件是獨立的,因此疊加過程中不重疊時間間隔內的事件也是獨立的。因此,它也是一個泊松過程。
反之亦然。如果一個泊松過程被分成兩個,透過以機率 p 選擇第一個過程中的事件,以機率 q = 1-p 選擇第二個過程中的事件,那麼這兩個過程就是引數分別為 和 的獨立泊松過程。
疊加和分解特性是泊松過程獨有的,並且源於其完全的隨機性。如果兩個非泊松過程(平均事件速率分別為 和 )疊加,則所得過程的平均事件速率為 ,但它既不是泊松過程,通常也不是更新過程(其中事件間時間是獨立且同分布的)。
然而,如果將大量獨立的非泊松過程(事件速率為 )疊加,則所得過程將為引數為 [2] 的泊松過程。
實際上,只有當 時,這才是完全正確的。同樣,它源於泊松過程的隨機性。對於固定的 ,隨著疊加過程數量的增加,每個過程的 必須減小。因此,疊加過程中來自同一個非泊松過程的事件變得越來越分散,使過程越來越隨機。
反之亦然。如果非泊松過程(平均速率為 )中的事件被不頻繁地抽樣(即,事件被抽樣的機率 p 很小),則所得抽樣過程的事件速率為
將是泊松過程。同樣,只有當 且 保持不變時,這才是完全正確的。
這些極限分佈有助於解釋泊松過程在計算機系統分析中的實用性。例如,如果作業是從大量終端提交的,則複合作業到達率將是每個終端提交過程的疊加。這些過程往往是獨立的。因此,如果終端數量很大,則複合過程將近似為泊松過程。在實踐中,只需要幾個終端就能使泊松分佈成為實際作業到達過程的一個很好的近似值。
再舉一個例子 [1],考慮在虛擬記憶體系統中向磁碟發出頁面傳輸請求的過程。這可能不是非常隨機,但如果磁碟扇區數量很大,並且請求以相同的機率指向這些扇區,則每個扇區的請求過程可以用泊松過程近似。
1. Gelenbe, E. 和 R.R. Muntz,“計算機系統的機率模型 - 第一部分(精確結果)”,《Acta Informatica》,第 7 卷,1976 年,第 35-66 頁。
2. Karlin,Samuel 和 Howard M. Taylor,《隨機過程導論》,學術出版社,1975 年。
3. Kobayashi,H,《建模與分析》,Addison Wesley,1978 年。










