跳轉至內容

機率/條件分佈

來自華夏公益教科書,開放的書籍,開放的世界



假設發生了一場地震。令 為傷亡人數, 為地震的里氏震級

(a) 在沒有給定任何資訊的情況下, 的分佈是什麼?

(b) 假設 的分佈是什麼?

(c) 假設 的分佈是什麼?

備註。

  • 表示地震微弱, 表示地震強烈。

你對 (a)、(b)、(c) 的答案是否不同?

在 (b) 和 (c) 中,我們分別有 條件 分佈 在給定 時的分佈,以及 條件 分佈 在給定 時的分佈。

一般情況下,我們有給定 條件分佈 (觀察 的值 之前 ),或者給定 (觀察 的值 之後 )。

條件分佈

[編輯 | 編輯原始碼]

回顧條件機率的定義: 其中 是事件,且。將此定義應用於離散隨機變數 ,我們有 其中 的聯合 pmf,而 的邊際 pmf。很自然地,我們將這種條件機率稱為條件 pmf,對吧?我們將這種條件機率記為。那麼,這基本上就是條件 pmf 的定義: 在給定 條件下的條件 pmf 是條件機率。自然地,我們希望條件 pdf 的定義也類似。事實確實如此。

定義。(條件機率函式)設 是兩個隨機變數,它們都是離散的或都是連續的。 條件 機率(質量或密度)函式為 在給定 的情況下,其中 是一個實數,是

備註。

  • 邊緣 pdf 可以被解釋為 歸一化 常數,它使積分 ,因為 (在 固定為 的區域上積分(滿足條件的區域),因此我們只在 的對應區間上積分 ( 仍然是一個變數))。
  • 這類似於條件機率定義中的分母,它使整個樣本空間的條件機率等於 1,以滿足機率公理。

為了更直觀地理解連續情況下的定義,請考慮以下圖表。

Top view:
     
        |
        |
        *---------------* 
        |               |
        |               |
fixed y *===============* <--- corresponding interval
        |               |
        |               |
        *---------------*
        |
        *---------------- x

Side view:

          *  
         / \ 
        *\  *  /                                           
       /|#\   \
   |  / |##\ / *---------*
   | *  |###\            /\
   | |\ |##/#\----------/--\     
   | | \|#/###*--------*   /                             
   | |  \/############/#\ /                              
   | |y *\===========/===*                               
   | | /  *---------*   /                                
   | |/              \ /                                 
   | *----------------*                                  
   |/                                                    
   *------------------------- x                          


Front view:
             
    |
    |
    |               
    *\     
    |#\    
    |##\   
    |###\             
    |####\   <------ Area: f_Y(y)
    |#####*--------*  
    |###############\ 
    *================*-------------- x

*---*
|###| : corresponding cross section from joint pdf
*---*   

我們可以看到,當我們對 進行條件化時,我們從聯合機率密度函式下的區域中“切”出一片,這片“切片”的面積就是 單變數 聯合機率密度函式 在固定 且變數 時,與 軸之間的面積。由於面積由 給出,而根據機率公理,面積應該等於 1。因此,我們透過將單變數聯合機率密度函式 除以 來縮小“切片”面積的 倍。之後,縮小“切片”頂部的那條曲線就是條件機率密度函式 的影像。

現在,我們已經討論了兩個隨機變數都是離散或連續的情況。那麼其中一個變數是離散,另一個是連續的情況呢?在這種情況下,這兩個隨機變數沒有“聯合機率函式”,因為一個是離散的,另一個是連續的!但是,我們仍然可以透過其他方式定義條件機率函式。為了引出下面的定義,設 是條件機率 。然後,對 關於 求導應該得到條件pdf 。所以,我們有 因此,自然地給出以下定義。

定義。(當 是連續的,而 是離散的)條件機率密度函式)令 為一個連續隨機變數,而 為一個離散隨機變數。條件機率密度函式 給定 ,其中 是一個實數,是

現在,我們來討論一下當 是離散的而 是連續的情況。在這種情況下,我們使用上述定義作為定義的動機。然而,我們應該交換 的位置,以確保假設仍然成立。然後,我們得到 在這種情況下, 是離散的,因此很自然地將給定 的條件機率質量函式定義為 在表示式中。現在,在重新排列項之後,我們得到 因此,我們有以下定義。

定義。(當 為離散且 為連續時的條件機率質量函式)令 為一個離散隨機變數,而 為一個連續隨機變數。 在給定 (其中 為實數)的條件機率密度函式為

基於條件機率函式的定義,我們可以自然地定義 條件 累積分佈函式如下。

定義。(條件累積分佈函式)令 為離散或連續隨機變數。 在給定 條件累積分佈函式 (cdf),其中 為實數,為

備註。

  • 需要注意的是,當 是連續的,事件 的機率為零。因此,根據條件機率的定義,在這種情況下,條件累積分佈函式應該是 未定義 的。然而,在這種情況下,我們仍然將條件機率定義為一個有意義且已定義的表示式。

定義的圖形說明(連續隨機變數)

Top view:
     
        |
        |
        *---------------* 
        |               |
        |               |
fixed y *=========@=====* <--- corresponding interval
        |         x     |
        |               |
        *---------------*
        |
        *---------------- 

Side view:

          *  
         / \ 
        *\  *  /                                           
       /|#\   \
   |  / |##\ / *---------*
   | *  |###\            /\
   | |\ |##/#\----------/--\     
   | | \|#/###*--------*   /                             
   | |  \/#########   / \ /                              
   | |y *\========@==/===*                               
   | | /  *-------x-*   /                                
   | |/              \ /                                 
   | *----------------*                                  
   |/                                                    
   *------------------------- x                          


Front view:

    |
    |
    |
    *\      
    |#\    
    |##\              
    |###\             
    |####\   <------------- Area: f_Y(y)         
    |#####*--------*  
    |###########    \ 
    *==========@=====*--------------  
               x
*---*
|###| : the desired region from the cross section from joint pdf, whose area is the probability from the cdf
*---*   

如果 對於某個事件 ,為了簡化,我們有一些特殊的記號

  • 給定 的條件機率函式變為

  • 給定 的條件累積分佈函式變為

命題。 (確定兩個隨機變數的獨立性)隨機變數 獨立的 當且僅當 對於每個 成立。

證明。 回想一下兩個隨機變數之間獨立性的定義

是獨立的,如果

對於每個 .

由於 對於每個 ,我們得到了所需的結果。

備註。

  • 這是意料之中的,因為對獨立事件的條件化不應該影響另一個獨立事件的發生。


我們可以將條件機率函式和cdf的定義擴充套件到隨機變數組,對於聯合cdf和聯合機率函式,如下所示

定義。 (條件聯合機率函式)令 為兩個隨機向量。給定 時, 條件 聯合機率函式為

然後,我們也有類似的命題來判斷兩個隨機向量的獨立性。

命題。 (確定兩個隨機向量的獨立性)隨機向量 當且僅當 對於每個

證明。 兩個隨機向量之間獨立性的定義是

  • 是獨立的,如果

對於每個

由於對於每個 ,我們有期望的結果。

雙變數正態分佈的條件分佈

[編輯 | 編輯原始碼]

回想一下機率/重要分佈一章, 的聯合機率密度函式為 ,並且在本例中 。其中 為正數。

命題。(二元正態分佈的條件分佈)設 . 那麼,(符號濫用:當我們說“”的分佈時,我們的意思是條件分佈在給定下的分佈)。

證明。

  • 首先,條件機率密度函式

  • 然後,我們可以看到 ,
  • 並且,透過對稱性(互換,以及互換),.

概念的條件版本

[編輯 | 編輯原始碼]

我們可以透過將先前為“無條件”分佈建立的概念的條件版本類推地應用於條件分佈,方法是將“無條件”的累積分佈函式 (cdf)、機率密度函式 (pdf) 或機率質量函式 (pmf)(即 )替換為它們的條件對應部分,即

條件獨立性

[編輯 | 編輯原始碼]

定義. 隨機變數 在給定 的情況下,條件 獨立,當且僅當 或者 。對於每個實數 以及每個正整數 ,其中 分別表示 在給定 的條件下的聯合累積分佈函式和機率函式。

備註。

  • 對於隨機變數,條件獨立和獨立之間沒有關係,也就是說其中一個意味著另一個。

示例. (條件獨立不意味著獨立)TODO

示例. (獨立不意味著條件獨立)TODO

條件期望

[編輯 | 編輯原始碼]

定義。 (條件期望)設 在給定 時的條件機率函式。則,

備註。

  • 的函式。
  • 這個 隨機變數 ,在計算期望後成為了 的函式,簡寫為 ,其中 代表相同項。
  • 實現 被觀察到為 ,其中 指的是相同的項。

類似地,我們有無意識統計學家定律的條件版本。

命題。 (無意識統計學家定律 (條件版本)) 令 在給定 下的條件機率函式。那麼,對於每個函式

命題。 (獨立性下的條件期望) 如果隨機變數 是獨立的, 對於每個函式

證明:

備註。

  • 如果 不獨立,則該等式可能成立。

示例: 假設隨機向量 其中 是獨立的隨機變數,且 。那麼, ( 被視為常數,因為它是條件化的:在實現 後它就變成了常數)但

的性質仍然適用於條件期望,其中所有“無條件”期望都被替換為“條件”期望,並進行了一些適當的修改,如下所示

命題. (條件期望的性質)對於每個隨機變數 ,

  • (線性)
對於每個函式 的函式, 以及每個隨機變數
  • (非負性) 如果 , 那麼
  • (單調性) 如果 , 那麼 對於每個隨機變數
  • (三角不等式)

  • (在獨立性下的乘法性) 如果 在給定 時條件獨立,

證明。 證明與“無條件”期望的證明類似。

備註。

  • 在給定 時被視為常數 給定,因為在觀察到 的值後,它們不能被改變。
  • 每個結果在用隨機向量 替換 時仍然成立。

關於條件期望的以下定理非常重要。

定理。 (全期望定律) 對於每個函式 和每個隨機變數

證明。

備註。

  • 我們可以用 代替 ,得到

推論. (全機率公式的推廣)對於每一個事件

證明。

  • 首先,

  • 然後,根據全期望公式,

備註。

  • 期望是針對 計算的,所以我們使用 符號。如果需要,我們會使用類似的符號來表示期望計算所針對的隨機變數。
  • 我們可以用 替換 ,它是一個隨機向量。
  • 如果 離散的,則結果的展開形式是 (全機率公式的離散情況)。
  • 如果 連續 的,那麼結果的展開形式為 (全機率公式的連續情況)。

推論。(全機率公式的期望版本)假設樣本空間 ,其中 互斥 的。那麼,

證明。 定義 如果 發生,其中 是一個正整數。那麼,

備註。

  • 事件的數量可以是有限的,只要它們是互斥的,並且它們的並集是整個樣本空間
  • 如果 ,它簡化為 全機率公式

示例。 是人類身高(單位:米)。從一個由 相同數量 的男性和女性組成的群體中隨機選擇一個人。假設男性的平均身高是 1.8 米,女性的平均身高是 1.7 米,那麼整個人口的平均身高是

推論。 (條件期望公式) 對於每個隨機變數 和事件 ,其中

證明。 根據條件期望加權平均計算期望的公式,,如果 ,則結果成立。

備註。

  • 如果 ,它將簡化為條件機率 定義,這是機率和期望之間的基本橋樑。

定義了 條件 期望後,我們也可以有 條件 方差、協方差和相關係數,因為方差、協方差和相關係數都是基於期望構建的。

雙變數正態分佈的條件期望

[edit | edit source]

命題。 (雙變數正態分佈的條件期望)令 . 那麼,

證明。

  • 該結果直接從關於雙變數正態分佈的條件分佈的命題得出。


條件方差

[編輯 | 編輯原始碼]

定義。 (條件方差)隨機變數 在給定 的條件下的 條件 方差是

類似地,我們有 條件 方差的性質,它們與方差的性質類似。

命題。 (條件方差的性質)對於每個隨機變數

  • (條件方差的替代公式)
  • (在位置引數變化下不變)
  • (二階齊次性)
  • (非負性)
  • (零方差意味著非隨機性) 對於某個 函式的
  • (獨立性下的可加性) 如果 在給定 條件下是獨立的,

證明. 證明類似於方差性質的證明。

除了全期望公式,我們還有全方差公式,如下

命題. (全方差公式) 對於每個隨機變數

證明。

備註。

  • 我們可以用 ,一個隨機向量,來替換

二元正態分佈的條件方差

[編輯 | 編輯來源]

命題。 (二元正態分佈的條件方差)令 。那麼,

證明。

  • 這個結果可以直接從關於二元正態分佈條件分佈的命題中得出。

備註。

  • 可以觀察到,條件中的 的精確值並不重要。對於不同的值,結果是相同的。


條件協方差

[編輯 | 編輯原始碼]

定義。(條件協方差) 在給定 條件 協方差為

命題。(條件協方差的性質)

(i) (symmetry) for each random variable , (ii) for each random variable , (iii) (alternative formula of covariance) (iv) for each constant , and for each random variables , (v) for each random variable ,


條件相關係數

[編輯 | 編輯原始碼]

定義。(條件相關係數)隨機變數 在給定 條件 相關係數為

備註。

  • 類似於“無條件”相關係數,條件 相關係數也介於 之間(包含邊界值)。證明方法類似,只是將所有無條件項替換為條件項。


條件分位數

[編輯 | 編輯原始碼]

定義。 (條件分位數) 給定 條件 分位數是 的:

備註。

  • 然後,我們可以得到 條件 中位數、四分位距等,它們以與無條件分位數相同的方式使用 條件 分位數來定義。


華夏公益教科書