跳轉到內容

機率/簡介

來自華夏公益教科書,開放的書籍,開放的世界

機率理論為隨機性和不確定性的研究提供了數學模型。從商業、政府、科學、娛樂,甚至個人生活中的許多重要決策,都必須在資訊不完整或存在一定程度的不確定性的情況下做出。因此,對不確定或隨機結果的正式研究在現代社會中佔有重要地位。在可能出現多種結果的情況中,機率論的數學模型提供了量化這些結果的可能性 associated with those outcomes. 機率還提供工具,使我們能夠超越僅僅描述資料集中的資訊(描述性統計),而真正從資料中推斷更多資訊(推斷性統計)。許多早期對可能性建模的嘗試來自機會遊戲。有關機率的簡史,請參見維基百科文章。

儘管機率論現在已經成為一個非常正式的數學分支,但機率的語言通常在日常語言中非正式使用。我們根據我們的經驗,以及在某些情況下根據統計資料,使用直覺來表達我們對涉及不確定性的情況中結果的可能性的信念。請考慮以下示例

  • 比爾說:“不要在這裡買鱷梨;大約有一半時間,它們都爛了。” 比爾正在表達他對事件發生的機率的信念——鱷梨會腐爛——這是基於他的個人經驗。
  • 麗莎說:“我 95% 確定西班牙的首都巴塞羅那。” 在這裡,麗莎表達的信念只是從她的角度來看的機率,因為只有她不知道西班牙的首都馬德里(從我們的角度來看,機率是 100%)。但是,我們仍然可以將其視為主觀機率,因為它表達了不確定性的度量。就好像麗莎在說“在我對這件事有和現在一樣肯定的 95% 的情況下,我最終會被證明是對的”。
  • 蘇珊說:“在奧馬哈被槍擊的可能性低於在底特律被槍擊的可能性。” 蘇珊正在表達基於(可能是)統計資料的信念。
  • 史密斯博士對克里斯蒂娜說:“你有 75% 的機會能活下來。” 史密斯博士是根據他的研究得出的這個結論。
  • 尼古拉斯說:“明天可能會下雨。” 在這種情況下,下雨的可能性用模糊的術語表達,並且是主觀的,但暗示說話者認為它大於(或 50%)。主觀機率已被廣泛研究,特別是在賭博和證券市場方面。雖然這種型別的機率很重要,但它不是本書的主題。一個很好的參考是史蒂文·維克 (2002) 的“信念程度”。

請注意,在前面的示例中,任何特定結果的可能性都用百分比(介於 0% 和 100% 之間)表示,這在日常語言中很常見。但是,正式機率論中的機率始終用間隔 中的實數表示(例如,機率 0.25 可以表示為 25%,或機率 可以表示為大約 31.83%)。常見機率表示式和正式機率論之間存在其他差異。例如,機率 0% 通常被認為意味著分配該機率的事件是不可能的。但是,在機率論中(通常在存在無限多個可能結果的情況下),分配機率為零的事件實際上可能發生。在某些情況下,可以肯定這樣的事件會發生(例如,在 0 和 1 之間選擇一個實數時,選擇任何給定數字的機率為零,但可以肯定的是,將選擇一個這樣的數字)。

表達結果機率的另一種方法是使用機率:事件發生的“成功”機率與事件不發生的“失敗”機率的比率。在博彩中,機率表示為參與者在賭注中所冒的賭注比率。例如:一個博彩公司提供3比1的賠率“反對”一匹馬,將支付給賭徒他們賭注的三倍(如果馬獲勝)。事實上,博彩公司(忽略諸如其潛在的“減免”會導致其面臨整體不可接受的損失的可能性等因素)宣佈他認為這匹馬獲勝的機率為。如果我們將賠率表示為“獲勝機率”:“不獲勝概率”,那麼3比1反對將表示為。因此,機率為 或 25% 的事件的機率為 33%。這種差異在事件機率為 50% 時更為明顯(例如,硬幣正面朝上的機率為 50%:50% = 1:1 或 )。

機率型別

[編輯 | 編輯原始碼]

如前所述,機率可以以多種不同的方式非正式地表達,但即使是正式定義和方法也各不相同。最普遍和最嚴格的方法被稱為公理機率論,這將是後續章節的重點。在這裡,我們簡要討論其他一些方法,以及它們的用途和侷限性。所有這些方法或多或少都依賴於實驗的概念。回想一下,機率提供了研究隨機性和不確定性的方法。

實驗是指任何結果可能受到不確定性或隨機性影響的行動或過程。

這裡的“實驗”一詞的使用範圍比它通常在受控實驗室環境中的含義更廣。關於實驗的進一步說明將在稍後給出,但現在以下實驗示例就足夠了

  • 觀察商品是否為缺陷產品。
  • 拋硬幣一次或多次,或從一副牌中抽取一張牌。
  • 進行調查。
  • 測量特定區域的風速或降雨量。

假設實驗可以在相同條件下重複進行,則每次重複實驗稱為試驗

基本概念

[編輯 | 編輯原始碼]

從概念上解釋機率有兩種標準方法:相對頻率方法和主觀信念(或置信方法)。在頻率機率論中,機率是在重複試驗中特定結果出現的相對頻率的極限(注意,任何單次試驗的結果不能依賴於其他試驗的結果)。相對頻率方法要求實驗是隨機的,並且在執行實驗之前所有可能的結果都是已知的。任何一組結果的機率表示為這些結果在多次重複試驗中出現的相對頻率。

物理機率屬於客觀機率或頻率機率的範疇,與輪盤、擲骰子和放射性原子等隨機物理系統有關。在這樣的系統中,給定結果(例如,骰子出現六點)在長時間的試驗中往往以穩定的速率或“相對頻率”出現。物理機率要麼解釋,要麼被用來解釋這些穩定的頻率。

相對頻率機率始終表示為介於 0%(結果幾乎永遠不會發生)和 100%(結果幾乎總是發生)之間的數字,或者類似地表示為介於 0 和 1 之間的數字。根據頻率機率論,“A 發生的機率為 p%”意味著,如果你在本質上相同的條件下重複進行實驗很多次,那麼 A 發生的次數與總試驗次數的比率將收斂到 p。例如,硬幣正面朝上的機率為 50%,這意味著如果你不斷地拋硬幣,那麼硬幣正面朝上的次數與總拋擲次數的比率將隨著拋擲次數的增加而趨近於 50%。請注意,一次拋擲的結果與另一次拋擲無關,並且正面朝上的次數與總拋擲次數的比率始終介於 0% 和 100% 之間。

在主觀機率論中,機率衡量說話者對一組結果將在 0%(完全不相信事件會發生)到 100%(完全相信事件會發生)的尺度上產生結果的“置信程度”。根據主觀機率論,“A 發生的機率為 ”意味著我相信 A 會發生的強度是 A 不會發生的強度的兩倍。主觀機率論在為原則上只能發生一次的結果的機率賦予意義時特別有用。例如,如何才能用相對頻率來解釋以下陳述的含義:“聖安地列斯斷層在 2050 年之前發生 8 級或更大地震的機率為 25%”?用相對頻率來量化這一指標將非常困難。

貝葉斯方法可以用來表示個人對給定可用證據的陳述的置信程度。證據機率,也稱為貝葉斯機率,可以賦予任何陳述,即使沒有涉及隨機過程。在大多數情況下,證據機率被認為是置信程度,在特定賠率的賭博傾向方面定義。主要的證據解釋包括經典解釋、主觀解釋、認識論或歸納解釋和邏輯解釋。

接下來的幾節將討論相對頻率機率方法中的主要理論。

古典機率論

[編輯 | 編輯原始碼]

機率的經典方法將機率表示為一系列連續試驗中有利結果的數量與所有可能結果的數量的比率。請注意,這直接意味著所有可能結果的數量必須是已知的。此外,所有可能的結果被認為是等可能的,並且沒有兩個可能的結果可以來自同一個試驗。在這裡,“有利”這個詞不是主觀的,而是表示結果屬於一組感興趣的結果。這組結果被稱為事件,它將在引入公理機率理論時被正式化。

機率的經典定義
如果屬於事件 的結果數量為 ,而結果的總數為 ,那麼事件 機率定義為

例如,一副標準撲克牌(不帶小丑)有 52 張牌。如果我們從牌堆中隨機抽取一張牌,我們可以將每張牌視為一個可能的結果。因此,共有 52 個結果。現在我們可以看看各種事件並計算它們的機率。

  • 在 52 張牌中,有 13 張梅花。因此,如果我們感興趣的事件是抽取一張梅花,那麼有 13 個有利結果,該事件的機率是
  • 有 4 張國王(每種花色一張)。抽取一張國王的機率是
  • 抽取一張國王或一張梅花的機率是多少?這個例子稍微複雜一些。我們不能簡單地將每個事件的結果數量分別加在一起(),因為這樣做無意中將其中一個結果計算了兩次(梅花國王)。正確答案是 ,來自 ,這本質上是

經典機率有一個嚴重的侷限性。機率的定義隱含地將所有結果定義為等機率的。雖然這可能對抽取卡片、擲骰子或從罈子裡抽取球很有用,但它沒有提供任何方法來處理具有不等機率的結果。

這種侷限性甚至會導致關於機率的錯誤陳述。一個經常給出的例子是這樣的

我明天可能會被流星擊中。有兩種可能的結果:我會被擊中,或者我不會被擊中。因此,我明天被流星擊中的機率是

當然,這裡的問題不在於經典理論,而在於試圖將該理論應用於不適合它的情況。

然而,這種侷限性並不意味著經典機率理論毫無用處。在公理化機率方法發展中的許多點上,經典理論都是一個重要的指導因素。

經驗機率或統計機率或發生頻率

[edit | edit source]

這種機率方法非常適合廣泛的科學學科。它基於這樣一個想法,即事件的潛在機率可以透過重複試驗來衡量。

經驗機率或統計機率作為頻率的度量
為事件 次試驗中發生的次數。我們定義事件 機率

當然,不可能進行無限多次試驗。但是,通常進行大量的試驗就足夠了,其中“大”的標準取決於所測量的機率以及我們需要多精確的測量。

關於機率定義的一個說明:我們怎麼知道序列 在極限情況下每次都會收斂到相同的結果,或者它會收斂嗎?不幸的是,我們不知道。為了說明這一點,考慮一個無限次拋硬幣的實驗。我們對正面朝上的機率感興趣。想象結果是以下序列

HTHHTTHHHHTTTTHHHHHHHHTTTTTTTTHHHHHHHHHHHHHHHHTTTTTTTTTTTTTTTT...

其中每個長度為 的正面序列和長度為 的反面序列後面跟著另一個兩倍長的序列。對於這個例子,序列 在大約 之間振盪,並且不收斂。

我們可能會認為這樣的序列不太可能出現,我們是對的。稍後將證明,這種序列的機率為 0,收斂到除事件的潛在機率之外的任何值的序列也是如此。但是,這樣的例子清楚地表明,上述定義中的極限並不代表更熟悉的意義上的收斂,而是某種機率意義上的收斂。準確地表述這意味著什麼的問題屬於公理化機率論。

公理化機率論

[edit | edit source]

雖然公理化機率論對初學者來說往往令人望而生畏,但它是機率的最普遍方法,已被用來解決機率中一些更困難的問題。它從一組公理開始,這些公理雖然不是立即直觀的,但以更熟悉的古典機率論為指導。這些公理將在(尚未編寫)的下一章中討論。

關於本書

[edit | edit source]

本書將使用微積分線性代數討論數學機率主題。本書的讀者在嘗試閱讀和理解本書之前,應該對這兩個主題有充分的瞭解。

華夏公益教科書