跳轉到內容

機率/隨機變數

來自華夏公益教科書,自由的教科書,為開放的世界

隨機變數

[編輯 | 編輯原始碼]

在許多實驗中,樣本空間中可能存在太多可能的結果,因此我們可能希望改為使用這些結果的“彙總變數”。例如,假設對 100 個人進行民意調查,詢問他們是否同意某項提案。然後,為了完全跟蹤這 100 個人的答案,我們可以先用數字表示他們的回答。

  • 數字“1”表示“同意”。
  • 數字“0”表示“不同意”。

(為了簡單起見,我們假設只有這兩個答案可用。)然後,為了記錄每個人對哪個答案的回答,我們使用一個包含 100 個數字的向量進行記錄。例如,,等等。由於向量中的每個座標都有兩個選擇:“0”或“1”,因此樣本空間中總共有 個不同的向量(用 表示)!因此,處理樣本空間中如此多的結果非常繁瑣和複雜 。相反,我們通常只關心有多少人“同意”和“不同意”,而不是每個人對哪個答案的回答,因為“同意”和“不同意”的數量決定了提案是否得到了他們中大多數人的同意,因此抓住了民意調查的本質。

因此,定義一個變數 更方便,它給出樣本空間中每個結果的 100 個座標中的“1”的數量 。然後, 只能取 101 個可能的值:0, 1, 2, ..., 100,這遠少於原始樣本空間中的結果數。

透過這樣做,我們可以將原始實驗更改為一個新實驗,其中變數 根據一定的機率取 101 個可能的值中的一個。對於這個新實驗,樣本空間變為

在定義變數 (稱為 隨機變數)的過程中,我們實際上(隱式地)定義了一個函式,其定義域是原始樣本空間,值域是 。通常,我們將隨機變數的陪域取為所有實數的集合 。也就是說,我們定義了隨機變數 ,其中 對於每一個 都成立。

為了正式定義隨機變數,我們需要可測函式的概念。

定義。(可測函式)令 是可測空間(也就是說, 分別是 -代數 )。一個函式 (-)可測,如果對於每一個 的逆像

備註。

  • 如果 -可測的,那麼我們也可以寫成 來強調對 -代數 的依賴。
  • 我們只考慮集合 -代數 中的原像,因為只有 中的集合是“良好行為”的,因此它們是“感興趣的”。然後, 的可測性確保原像也是“良好行為”的。
  • 因此,可測函式在某種程度上保留了集合的“良好行為”。
  • 事實證明,在定義中使用原像(而不是像)更有用。

定義。 (隨機變數)

隨機變數的圖形說明。

是一個機率空間。一個 隨機變數 是一個 -可測函式 .

備註。

  • 通常,用大寫字母來表示隨機變數,用對應的小寫字母來表示隨機變數的實現值(即,從樣本點對映的數值)。例如,我們說隨機變數 的實現值為 .
  • -代數 上的 Borel -代數。我們在這裡將不會詳細討論它的定義。
  • 由於 -可測的,對於每個集合 ,原像
  • 通常用 來表示 。此外,我們用 等來表示 等。
  • 我們要求隨機變數是 -可測的,以便機率 (通常寫成 )對於每個 定義的。(機率測度的定義域是 ,並且 是因為隨機變數 -可測性。)
  • 一般而言,大多數我們能想到的函式(應該為隨機變數)都是 -可測的。因此,我們假設這裡構建的隨機變數是 -可測的,因此實際上是有效的,無需證明。

透過定義一個從機率空間 到實數空間的隨機變數 ,我們實際上 誘導 出一個新的機率空間 ,其中

  • 誘導的樣本空間 是隨機變數 值域
  • 誘導的事件空間 -代數 。(這裡我們遵循之前的慣例:當 可數時,。)
  • 誘導的機率測度 定義為

對於每個

結果證明,誘導的機率測度滿足所有機率公理

例: 證明誘導機率測度 滿足所有機率公理,因此是有效的。

證明: 非負性: 對於任何事件 單位性: 我們有 特別地,對於任何 ,我們始終有 (因為 是隨機變數 的取值範圍)。

可數可加性:對於任意一個兩兩不相交事件的無限序列 (每個事件都屬於 ),


證明了這個結果後,可以得出之前討論的所有機率測度的性質也適用於誘導的機率測度 。因此,我們可以利用機率測度的性質來計算機率 ,從而計算出 ,對於任意集合 。更一般地,為了計算機率 對於任意 ( 不一定屬於 ),我們注意到 ,並且發現 。因此,我們可以透過考慮 來計算

示例。 假設我們拋擲一枚公平的硬幣兩次。那麼,樣本空間可以用 表示。現在,我們將隨機變數 定義為樣本點拋擲中獲得的正面數(這意味著 將樣本空間中的每個樣本點對映到該樣本點中獲得的正面數)。那麼,我們有 因此,。因此,我們有 (樣本空間中的四個結果應該是等機率的。)(通常用 代替 代替 等等。)

Clipboard

練習。 假設我們拋擲一枚公平的硬幣三次,並定義隨機變數 為樣本點拋擲中獲得的正面次數。那麼,。計算機率 對於每個 。因此,計算機率 對於每個 。(提示: 我們可以寫 。現在,考慮 。)

解答

首先,我們有 因此,我們有 由於 ,因此,我們有

有時,即使不可能列出樣本空間中的所有樣本點,我們也可以確定與隨機變數相關的機率。

示例。 考慮關於動機部分中討論的民意調查的示例。我們將隨機變數定義為給出“1”的數量。這裡,我們假設樣本空間中的每個樣本點都是等可能的。證明 對於每個

證明。 由於有 個樣本點包含 個“1”(將此視為將 個不可區分的“1”放置到 100 個可區分的單元格中),結果隨之而來。

備註。

  • 例如,
  • 繪製不同 值下 的值。


一類非常有用的特殊隨機變數是指示隨機變數,它是 指示函式 的特例。

定義. (指示函式)

指示函式的圖形說明。 “凸起部分” 是集合 ,整個紅色正方形是集合

集合 的子集 的指示函式是一個函式 ,定義為

備註。

  • 特例:我們可以透過稍微修改一下指示函式,將其視為一個隨機變數。
  • 為一個機率空間,而 為一個事件。 然後,事件 的指示隨機變數是 (這裡,我們將陪域改為 ,以符合隨機變數的定義)定義為

示例: 假設我們從某個城市中隨機選擇一名市民,並記錄該市民的年收入 (以該城市使用的貨幣單位計)。在這種情況下,我們可以將樣本空間定義為 。假設該城市制定了一項稅收政策,規定年收入超過 10000(與 相同的貨幣單位)則為 應稅收入。現在,我們令 表示記錄的年收入的應稅部分。更準確地說, 定義為 ,對於每個 。也就是說,,表示為 ,對於每個

示例。 假設我們擲兩個不同的骰子,並定義 為擲骰結果的數字之和。 那麼,樣本空間為 。 這裡我們可以看到 的取值範圍是 。 計算每個

。 注意,在樣本空間中,有 1、2、3、4、5、6、5、4、3、2、1 個樣本點,分別對應於 。 因此,我們有

Clipboard

練習。 計算 的機率。 (答案:)

解答

該機率為


累積分佈函式

[編輯 | 編輯原始碼]

對於每個隨機變數 ,都存在一個與之相關的函式,稱為 累積分佈函式 (cdf) 的

定義。

三個累積分佈函式的例子,用紅色線和點表示在兩條藍色線之間。

(累積分佈函式) 隨機變數 累積分佈函式 (cdf),記為 (或 ) 是 對於每個

示例。 考慮之前的一個練習,我們拋一枚公平的硬幣三次,隨機變數 被定義為樣本點中獲得的正面次數。我們已經計算出 。因此,隨機變數 的累積分佈函式由 圖表上,累積分佈函式是一個階梯函式,每個 都有一個跳躍,跳躍的大小為

累積分佈函式中“跳躍”的示意圖。

從上面的例子中的累積分佈函式可以看出,累積分佈函式不一定是連續的。在跳躍點處有幾個不連續點。但我們可以注意到,在每個跳躍點,累積分佈函式取跳躍的頂端的值,這是根據累積分佈函式的定義(所涉及的不等式也包含等式)。簡單來說,這表明累積分佈函式是右連續的。但是,累積分佈函式一般來說不是左連續的。

下面,我們將討論累積分佈函式的三個定義屬性。

定理。(累積分佈函式的定義屬性)函式 是隨機變數 的累積分佈函式當且僅當

(i) 對於每個實數

(ii) 是單調不減的。

(iii) 是右連續的。

證明。 充分性( 是累積分佈函式 這三個屬性)

(i) 它遵循機率公理,因為 被定義為機率。

(ii)

(iii) 固定一個任意的正數列 ,其中 。對每個正數 ,定義 。因此,。然後, 因此 對每個 其中 。也就是說,,這就是右連續性的定義。

如果部分更復雜。以下內容是可選的。概述

  1. 繪製任意一條滿足這三個性質的曲線。
  2. 無限次拋擲一枚公平的硬幣。
  3. 將每次結果編碼成二進位制數,例如
  4. 將每個二進位制數轉換為十進位制數,例如。然後,十進位制數是一個隨機變數
  5. 使用此十進位制數作為任意繪製曲線反函式的輸入,我們得到一個值,該值也是一個隨機變數,比如
  6. 然後,我們得到了隨機變數 的累積分佈函式,如果我們無限次地拋一枚公平的硬幣。


有時,我們只對 這樣使得 的值感興趣,這些值更為“重要”。粗略地說,這些值實際上是支撐集 的元素,該集合將在下文中定義。

定義。(隨機變數的支撐集)隨機變數支撐集,是最小的閉集,使得

備註。

  • 例如,閉區間是閉集。
  • 本書不會重點強調閉合性。
  • 實際上,(這是最小的閉集)。
  • 是離散隨機變數的機率質量函式
  • 是連續隨機變數的機率密度函式
  • 上述術語將在後面定義。

示例. 如果 那麼 ,因為 ,並且該集合是滿足此要求的所有集合中最小的集合。

備註. 等等也滿足要求,但它們不是最小的集合。

Clipboard

練習。

假設我們拋擲一枚不公平的硬幣。定義 如果正面朝上, 否則。令 的累積分佈函式。

1

由於沒有給出正面朝上的機率,因此無法確定。

2 假設 ,計算

0
0.3
0.5
0.7
1

3 假設 。以下哪些陳述是正確的?

如果硬幣是公平的。


離散隨機變數

[edit | edit source]

定義。 (離散隨機變數) 如果 可數的 (即“可列舉的”或“可列出的”),則隨機變數 是一個 離散 隨機變數。

例子。 次伯努利試驗中成功的次數。 那麼, 是一個離散隨機變數,因為 是可數的。

另一方面,如果我們讓 是攝氏溫度, 不是離散的,因為 是不可數的。

Clipboard

練習。

以下哪些是(是)離散隨機變數?

拋擲一枚硬幣三次出現的正面次數。
介於 0 和 1 之間(包括 0 和 1)的數字。
多項選擇題中正確選項的數量,其中最多有三個正確選項。
對要求數值答案的簡短問題的答案。
隨機變數為離散隨機變數的機率。


通常,對於離散隨機變數,我們感興趣的是隨機變數取特定值的機率。因此,我們有一個函式可以給出每個特定值所對應的機率,即 機率質量函式

定義。

pmf 的一個例子。該函式稱為機率質量函式,因為每個點的值可以解釋為位於該點的質量

(機率質量函式) 令 為離散隨機變數。 的機率質量函式 (pmf) 是

備註。

  • 其他名稱包括質量函式和機率函式。
  • 如果隨機變數 是離散的,那麼 (它是封閉的)。
  • 隨機變數 的累積分佈函式 (cdf) 為 。 因此,pmf 在支援內每個 處的值的總和等於 1。
  • 離散隨機變數 的 cdf 是一個階梯函式,在 中的點處跳躍,每個跳躍的大小定義了 中對應點的 pmf。

例如。 假設我們擲一個公平的六面骰子一次。 令 為朝上的數字。 那麼, 的 pmf 是

Clipboard

練習。

1 以下哪些是 (是) pmf?

. 給定是可數的。

2 計算,使得函式 是一個機率質量函式。


連續隨機變數

[edit | edit source]

假設 是一個離散隨機變數。將 分割成小的不相交的區間 得出 特別地,每單位的機率可以被解釋為 在該區間上的機率密度。(密度越高,分配給該區間的機率就越多)。

取極限, 其中,直觀且非嚴格地, 可以理解為在“無窮小”區間 上的機率,即 ,而 可以理解為在這個“無窮小”區間上的機率密度,即 .

這些促使我們給出如下定義。

定義. (連續型隨機變數) 隨機變數 連續型,如果對於每個(可測)集合 以及某個 非負 函式 ,有 成立。

備註。

  • 函式 被稱為 機率密度函式 (pdf),密度函式,或機率函式(很少見)。
  • 如果 為連續型,則 pdf 在每個 單點值 上的值為零,即 對每個實數 成立。
  • 可以透過設定 來證明這一點,則 (啞變數已更改)。
  • 透過設定 ,累積分佈函式
  • 可測性不會被強調。本書中遇到的集合都是可測的。
  • 是 pdf 在 下的面積,它表示機率(透過將密度函式在集合 上積分得到的)。

名稱 連續 隨機變數來自這樣的結果,即這種隨機變數的累積分佈函式是連續的。

命題。(連續隨機變數的累積分佈函式的連續性)如果隨機變數 是連續的,它的累積分佈函式 也是連續的(不僅僅是右連續)。

證明。 由於 (黎曼積分是連續的),累積分佈函式是連續的。

示例。(指數分佈)函式 是連續隨機變數的累積分佈函式,因為

  • 它是非負的。
  • . 因此,.
  • 它是不減的。
  • 它是右連續的(也是連續的)。
Clipboard

練習。

1 以下哪些是機率密度函式(PDF)?

2 計算 使得函式 為機率密度函式。

不存在這樣的 .

3 計算 使得函式 是一個累積分佈函式。

不存在這樣的 .

4 以下哪些是正確的?

如果一個隨機變數的支撐集是可數的,那麼它是離散的。
如果一個隨機變數的支撐集是不可數的,那麼它是連續的。
如果一個隨機變數的支撐集是不可數的,那麼它不是離散的。


命題。 (用累積分佈函式求機率密度函式) 如果連續隨機變數的累積分佈函式 可微,那麼機率密度函式 .

證明。 這是由微積分基本定理得到的:

備註。 由於 是單調不減的,。 這表明如果 可微,則 始終是非負的。 這是我們定義機率密度函式為非負的動機。

在沒有進一步假設的情況下,機率密度函式 是唯一的,即一個隨機變數可能有多個機率密度函式,例如,我們可以在其支撐集之外的單個點上將機率密度函式的值設定為一個實數(不會影響機率,因為機率密度函式在單個點的值為零,無論其值如何),這將為一個隨機變數建立另一個有效的機率密度函式。 為了解決這個問題,我們通常將 設定為每個 ,以使機率密度函式變得唯一,並使計算更方便。

示例:(均勻分佈)已知 是連續隨機變數 的機率密度函式,則機率

Clipboard

練習。

已知函式 是連續隨機變數 的機率密度函式。

1 計算 .

2 計算 .

3 計算 .



混合隨機變數

[edit | edit source]

在閱讀了前兩節之後,你可能會認為隨機變數要麼是離散的,要麼是連續的。實際上,這是錯誤的。隨機變數可以既不是離散的也不是連續的。這種隨機變數的一個例子是本節討論的 混合 隨機變數。

定理。 (cdf 分解) 每個隨機變數 的 cdf 可以分解為三個部分的總和: 其中 是非負常數,使得 ,其中 是一個實數, 分別是離散、連續和奇異隨機變數的 cdf。

備註。

  • 如果 ,則 是一個混合隨機變數。
  • 我們不會在本書中討論奇異隨機變數,因為它比較高階。
  • 這個公式的一種解釋是:
  • 如果 是離散(連續)隨機變數,那麼 ( )。
  • 我們也可以類似地分解pdf,但我們有不同的方法從相應的cdf中找到離散和連續隨機變數的pdf。

奇異隨機變數的一個例子是 康托爾分佈函式(有時稱為魔鬼的樓梯),如下圖所示。當您放大圖形時,圖形模式會不斷重複。

康托爾分佈函式

例:。令 。那麼, 是一個混合隨機變數 的 cdf,它以機率 為離散,以機率 為連續,因為它是非負的、非遞減的、右連續的,並且

Clipboard

練習: 考慮函式 。已知 是隨機變數 的 cdf。

(a) 證明

(b) 證明 的 pdf 為

(c) 證明 為連續型隨機變數的機率為

(d) 證明 等於

(e) 證明事件 時相互獨立。


證明。

(a) 由於 是累積分佈函式,且當 時,,因此,

(b) 由於 是混合型隨機變數,對於離散型隨機變數部分,機率密度函式為 另一方面,對於連續型隨機變數部分,機率密度函式為 因此, 的機率密度函式為

(c) 可以看到 可以分解如下: 因此, 為連續變數的機率為

(d)

(e) 如果 。 因此, 也就是說 是相互獨立的。

華夏公益教科書