跳轉到內容

統計學/機率

來自華夏公益教科書,開放的書籍,開放的世界

統計學


  1. 簡介
    1. 什麼是統計學?
    2. 現代統計學中的學科
    3. 為什麼我應該學習統計學? 0% developed
    4. 學習統計學需要哪些知識?
  2. 不同型別的資料
    1. 原始資料和二手資料
    2. 定量資料和定性資料
  3. 資料收集方法
    1. 實驗
    2. 抽樣調查
    3. 觀察性研究
  4. 資料分析
    1. 資料清洗
    2. 移動平均
  5. 彙總統計量
    1. 集中趨勢度量
      1. 平均數、中位數和眾數
      2. 幾何平均數
      3. 調和平均數
      4. 算術平均數、幾何平均數和調和平均數之間的關係
      5. 幾何中位數
    2. 離散程度度量
      1. 資料的極差
      2. 方差和標準差
      3. 四分位數和四分位距
      4. 分位數
  6. 資料顯示
    1. 條形圖
    2. 比較條形圖
    3. 直方圖
    4. 散點圖
    5. 箱線圖
    6. 餅圖
    7. 比較餅圖
    8. 象形圖
    9. 線形圖
    10. 頻率多邊形
  7. 機率
    1. 組合學
    2. 伯努利試驗
    3. 貝葉斯分析入門
  8. 分佈
    1. 離散分佈
      1. 均勻分佈
      2. 伯努利分佈
      3. 二項分佈
      4. 泊松分佈
      5. 幾何分佈
      6. 負二項分佈
      7. 超幾何分佈
    2. 連續分佈
      1. 均勻分佈
      2. 指數分佈
      3. 伽馬分佈
      4. 正態分佈
      5. 卡方分佈
      6. 學生t分佈
      7. F分佈
      8. 貝塔分佈
      9. 威布林分佈
  9. 檢驗統計假設
    1. 統計檢驗的目的
    2. 使用的形式
    3. 不同型別的檢驗
    4. 單個均值的z檢驗
    5. 兩個均值的z檢驗
    6. 單個均值的t檢驗
    7. 兩個均值的t檢驗
    8. 配對t檢驗,用於比較均值
    9. 單因素方差分析F檢驗
    10. 單個比例的z檢驗
    11. 兩個比例的z檢驗
    12. 在Microsoft Excel中檢驗比例A是否大於比例B
    13. 斯皮爾曼等級相關係數
    14. 皮爾遜積矩相關係數
    15. 卡方檢驗
      1. 多個比例的卡方檢驗
      2. 列聯表的卡方檢驗
    16. 分佈的近似
  10. 點估計100% developed  as of 12:07, 28 March 2007 (UTC) (12:07, 28 March 2007 (UTC))
    1. 無偏性
    2. 優良性度量
    3. UMVUE
    4. 完備性
    5. 充分性與最小充分性
    6. 輔助性
  11. 練習題
    1. 彙總統計量問題
    2. 資料顯示問題
    3. 分佈問題
    4. 資料檢驗問題
  12. 數值方法
    1. 基本線性代數和格拉姆-施密特正交化
    2. 無約束最佳化
    3. 分位數迴歸
    4. 統計軟體的數值比較
    5. Excel中的數值
    6. 統計學/數值方法/隨機數生成
  13. 時間序列分析
  14. 多元資料分析
    1. 主成分分析
    2. 度量資料的因子分析
    3. 序資料的因子分析
    4. 典型相關分析
    5. 判別分析
  15. 特定資料集的分析
    1. 結核病分析
  16. 附錄
    1. 作者
    2. 詞彙表
    3. 索引
    4. 連結

編輯此框


擲兩個骰子,它們的和等於7的機率是多少?

機率與一些不可預測性有關。我們知道可能出現哪些結果,但不能確定具體是哪一個。所有可能結果的集合起著基本作用。我們稱之為樣本空間,並用S表示。S的元素稱為結果。擲骰子的樣本空間為S = {1,2,3,4,5,6}。我們不僅談論結果,還談論事件,結果的集合(或樣本空間的子集)。例如,擲骰子時,我們可以詢問結果是否為偶數,這意味著詢問“偶數”事件= E = {2,4,6}。在結果數量有限的簡單情況下,我們為每個結果s (∈ S) 指定其機率(出現機率)p(s)(用小寫p表示),它是一個介於0和1之間的數。這是一個非常簡單的函式,稱為機率函式,其唯一其他屬性是所有機率的總和為1。我們也討論事件A的機率P(A)(用大寫P表示),它只是A中所有結果的機率之和。對於一個公平的骰子,p(s) = 1/6,對於每個結果s,P(“偶數”) = P(E) = 1/6+1/6+1/6 = 1/2。

非有限樣本空間的機率的一般概念稍微複雜一些,儘管它建立在相同的想法之上。

為什麼在統計學教科書中要學習機率?

[編輯 | 編輯原始碼]

數學中很少有真正自包含的東西。許多數學分支相互接觸和相互作用,機率和統計領域也不例外。對機率的基本理解對於理解基本統計學至關重要,而機率在沒有統計學來確定“現實世界”機率的情況下在很大程度上是抽象的。

本節並非旨在對機率進行全面講授,而是簡單地觸及本課程所需的機率基礎,涵蓋貝葉斯分析的基礎知識,以供那些尋求更有趣內容的學生使用。這些知識對於嘗試理解各種分佈的數學原理將非常寶貴,這些分佈將在後面介紹。

集合概念

[編輯 | 編輯原始碼]

集合是一組物件。我們通常用大寫字母表示集合,例如,A是這個房間裡所有女性的集合。

  • 集合A的成員稱為A的元素,例如,帕特里夏是A的一個元素(帕特里夏∈ A);帕特里克不是A的一個元素(帕特里克∉ A)。
  • 全集U是所考慮的所有物件的集合,例如,U是這個房間裡所有人的集合。
  • 空集或空集∅沒有任何元素,例如,這個房間裡身高超過2.8米的男性集合是一個空集。
  • 集合A的補集Ac是U中不在A中的所有元素的集合,即,x ∈ Ac 當且僅當 x ∉ A。
  • 設A和B為2個集合。如果A的每個元素也是B的元素,則A是B的子集。寫成A ⊂ B,例如,這個房間裡戴金屬框眼鏡的女性集合 ⊂ 戴眼鏡的女性集合 ⊂ 這個房間裡的女性集合。

• 兩個集合A和B的交集A ∩ B是共同元素的集合。即,x ∈ A ∩ B 當且僅當 x ∈ A 且 x ∈ B。

• 兩個集合A和B的並集A ∪ B是A或B中所有元素的集合。即,x ∈ A ∪ B 當且僅當 x ∈ A 或 x ∈ B。

韋恩圖和符號

[編輯 | 編輯原始碼]

韋恩圖以視覺方式對定義的事件進行建模。每個事件用一個圓圈表示。具有共同結果的事件將重疊,被稱為事件的交集。

韋恩圖。


機率公理

[編輯 | 編輯原始碼]

計算機率

[編輯 | 編輯原始碼]

否定是一種表達“非A”的方式,因此表示A的補集已經發生。注意:事件A的補集可以表示為A'或Ac
例如:“六面骰子落在1上的機率是多少?”(六分之五,或p = 0.833)

事件的補集

或者,更口語化地說,“‘非X’的機率加上‘X’的機率等於1或100%。”

相對頻率描述了成功次數與總結果次數之比。例如,如果拋硬幣50次,其中29次正面朝上,那麼相對頻率是


兩個事件的並集是指你想知道事件A或事件B。
這與“和”不同。“和”是交集,而“或”是事件的並集(兩個事件合在一起)。


在上面的事件示例中,你會注意到...

事件A是星星和鑽石。

事件B是三角形、五邊形和星星。
(A ∩ B) = (A 和 B) = A 與 B 的交集,只有星星
但 (A ∪ B) = (A 或 B) = A 與 B 的並集,是所有東西。三角形、五邊形、星星和鑽石
注意,事件A和事件B都有星星作為共同點。但是,當你列出事件的並集時,你只列出星星一次!
事件A = 星星,鑽石 事件B = 三角形,五邊形,星星
當你將它們組合在一起時,你得到(星星+鑽石)+(三角形+五邊形+星星),但是等等!星星被列出了兩次,所以需要從列表中減去多餘的星星。
你應該注意到,是交集被列出了兩次,所以你必須減去重複的交集。

事件並集的公式:P(A ∪ B) = P(A) + P(B) - P(A ∩ B)

示例
設 P(A) = 0.3,P(B) = 0.2,P(A ∩ B) = 0.15。求 P(A ∪ B)。
P(A ∪ B) = (0.3) + (0.2) - (0.15) = 0.35

示例
設 P(A) = 0.3,P(B) = 0.2,P(A ∩ B) = 0。求 P(A ∪ B)。
注意:由於事件的交集為空集,那麼你便知道事件是分離的或互斥的。
P(A ∪ B) = (0.3) + (0.2) - (0) = 0.5

全機率定理

[編輯 | 編輯原始碼]

全機率定理[1] 是一個定理,在離散情況下,它表明如果 {\displaystyle \left\{{B_{n}:n=1,2,3,\ldots }\right\}}\left\{{B_{n}:n=1,2,3,\ldots }\right\} 是樣本空間的一個有限或可數無限劃分(換句話說,一組兩兩不相交的事件,它們的並集是整個樣本空間),並且每個事件 {\displaystyle B_{n}}B_{n} 是可測的,那麼對於同一個機率空間的任意事件 {\displaystyle A}A

{\displaystyle P(A)=\sum _{n}P(A\cap B_{n})}{\displaystyle P(A)=\sum _{n}P(A\cap B_{n})} 或者,另一種說法是[1]

{\displaystyle P(A)=\sum _{n}P(A\mid B_{n})P(B_{n}),}{\displaystyle P(A)=\sum _{n}P(A\mid B_{n})P(B_{n}),} 其中,對於任何 {\displaystyle n}n,如果 {\displaystyle P(B_{n})=0}{\displaystyle P(B_{n})=0},這些項將被簡單地從求和中省略,因為 {\displaystyle P(A\mid B_{n})}{\displaystyle P(A\mid B_{n})} 是有限的。

條件機率

[編輯 | 編輯原始碼]

給定另一個事件發生的情況下,一個事件的機率是多少?例如,給定老鼠找到了迷宮的房間,那麼它找到迷宮盡頭的機率是多少?

這用以下方式表示

或“給定B的情況下,A的機率”。

如果AB彼此獨立,例如拋硬幣或生育孩子,那麼

因此,“給定上一個孩子是男孩,那麼下一個孩子是男孩的機率是多少?”

這也可疊加,其中A的機率有幾個“給定”。

或“給定B1、B2和B3為真,那麼A的機率是多少?”

-->


結論:綜合起來

[編輯 | 編輯原始碼]
華夏公益教科書