跳轉到內容

統計學/導論/需要了解的知識

來自華夏公益教科書,為開放世界提供開放書籍

統計學


  1. 導論
    1. 什麼是統計學?
    2. 現代統計學中的學科
    3. 為什麼我應該學習統計學? 0% developed
    4. 學習統計學需要了解哪些知識?
  2. 不同型別的資料
    1. 原始資料和二手資料
    2. 定量資料和定性資料
  3. 資料收集方法
    1. 實驗
    2. 抽樣調查
    3. 觀察研究
  4. 資料分析
    1. 資料清洗
    2. 移動平均
  5. 彙總統計
    1. 集中趨勢的度量
      1. 平均值、中位數和眾數
      2. 幾何平均數
      3. 調和平均數
      4. 算術平均數、幾何平均數和調和平均數之間的關係
      5. 幾何中位數
    2. 離散程度的度量
      1. 資料的範圍
      2. 方差和標準差
      3. 四分位數和四分位數範圍
      4. 分位數
  6. 資料顯示
    1. 條形圖
    2. 比較條形圖
    3. 直方圖
    4. 散點圖
    5. 箱線圖
    6. 餅圖
    7. 比較餅圖
    8. 象形圖
    9. 折線圖
    10. 頻率多邊形
  7. 機率
    1. 組合學
    2. 伯努利試驗
    3. 貝葉斯分析入門
  8. 分佈
    1. 離散分佈
      1. 均勻分佈
      2. 伯努利分佈
      3. 二項分佈
      4. 泊松分佈
      5. 幾何分佈
      6. 負二項分佈
      7. 超幾何分佈
    2. 連續分佈
      1. 均勻分佈
      2. 指數分佈
      3. 伽馬分佈
      4. 正態分佈
      5. 卡方分佈
      6. 學生t分佈
      7. F分佈
      8. 貝塔分佈
      9. 威布林分佈
  9. 檢驗統計假設
    1. 統計檢驗的目的
    2. 使用形式
    3. 不同型別的檢驗
    4. 單樣本z檢驗
    5. 雙樣本z檢驗
    6. 單樣本t檢驗
    7. 雙樣本t檢驗
    8. 配對樣本t檢驗比較均值
    9. 單因素方差分析F檢驗
    10. 單樣本比例z檢驗
    11. 雙樣本比例z檢驗
    12. 在Microsoft Excel中檢驗比例A是否大於比例B
    13. 斯皮爾曼秩相關係數
    14. 皮爾遜積矩相關係數
    15. 卡方檢驗
      1. 多樣本比例卡方檢驗
      2. 列聯表卡方檢驗
    16. 分佈的近似
  10. 點估計100% developed  as of 12:07, 28 March 2007 (UTC) (12:07, 28 March 2007 (UTC))
    1. 無偏性
    2. 優良性的度量
    3. UMVUE
    4. 完備性
    5. 充分性和最小充分性
    6. 輔助性
  11. 練習題
    1. 彙總統計練習題
    2. 資料顯示練習題
    3. 分佈練習題
    4. 資料檢驗練習題
  12. 數值方法
    1. 基本線性代數和格拉姆-施密特正交化
    2. 無約束最佳化
    3. 分位數迴歸
    4. 統計軟體的數值比較
    5. Excel中的數值
    6. 統計學/數值方法/隨機數生成
  13. 時間序列分析
  14. 多元資料分析
    1. 主成分分析
    2. 度量資料的因子分析
    3. 序數資料的因子分析
    4. 典型相關分析
    5. 判別分析
  15. 特定資料集的分析
    1. 結核病分析
  16. 附錄
    1. 作者
    2. 詞彙表
    3. 索引
    4. 連結

編輯此框


統計學是一個多元化的學科,因此所需數學知識取決於我們所研究的統計學型別。大多數多元統計學需要紮實的線性代數基礎,但對於入門統計學來說則不是必需的。無論研究哪個統計學分支,微積分基礎知識都是很有用的。

最低限度,學生應該掌握代數中教授的基本概念,並且對“移動事物”和求解未知數感到舒適。這裡大多數統計學都源於一些基本的事物,讀者應該熟悉這些事物。

絕對值

[編輯 | 編輯原始碼]


如果數字是零或正數,則該數字的絕對值就是該數字本身。如果數字是負數,則去掉負號即可得到絕對值。

  • |42| = 42
  • |-5| = 5
  • |2.21| = 2.21

階乘是在機率中經常使用的一種計算。它只針對大於或等於零的整數定義,如下所示:

簡而言之,這意味著:

0! = 1 = 1
1! = 1 · 1 = 1
2! = 2 · 1 = 2
3! = 3 · 2 · 1 = 6
4! = 4 · 3 · 2 · 1 = 24
5! = 5 · 4 · 3 · 2 · 1 = 120
6! = 6 · 5 · 4 · 3 · 2 · 1 = 720

求和(也稱為級數)在統計學中應用非常廣泛,幾乎比任何其他技術都多。它是一種表示對大量值的加法的方法,無需在每個加號後面加上加號。我們使用大寫西格瑪符號 ∑ 來表示求和。

例子

[edit | edit source]

在統計學中,我們經常對一組相關的變數進行求和。

這裡,我們正在對所有 x 變數進行求和(希望在計算時,所有 x 變數都具有值)。∑ 下面的表示式(本例中為 i=0)代表索引變數及其起始值(i 的起始值為 0),而 ∑ 上面的數字代表變數將遞增到的值(步長為 1,因此 i = 0, 1, 2, 3, 然後 4)。另一個例子:

請注意,我們可以透過將 2 移到求和符號之外來獲得相同的值(先執行求和,然後再乘以 2,而不是將求和的每個組成部分都乘以 2)。

無窮級數

[edit | edit source]

當然,級數並不一定要以任何確定的值或有限值進行計數——它可以無限地繼續下去。這些級數被稱為“無窮級數”,有時它們甚至可以收斂到一個有限值,當級數中的項數接近無窮大 (∞) 時,最終會等於該值。

例子

[edit | edit source]

這個例子是著名的幾何級數。請注意,該級數趨於 ∞(無窮大,這意味著它不會停止),並且它只對變數 r 的某些值有效。這意味著如果 r 在 -1 和 1 之間 (-1 < r < 1),那麼當級數擴充套件得越遠時,求和將越來越接近(即收斂到)1 / 1-r

線性逼近

[edit | edit source]
v / α 0.20 0.10 0.05 0.025 0.01 0.005
40 0.85070 1.30308 1.68385 2.02108 2.42326 2.70446
50 0.84887 1.29871 1.67591 2.00856 2.40327 2.67779
60 0.84765 1.29582 1.67065 2.00030 2.39012 2.66028
70 0.84679 1.29376 1.66691 1.99444 2.38081 2.64790
80 0.84614 1.29222 1.66412 1.99006 2.37387 2.63869
90 0.84563 1.29103 1.66196 1.98667 2.36850 2.63157
100 0.84523 1.29007 1.66023 1.98397 2.36422 2.62589
學生 t 分佈在不同自由度下,對應不同臨界值。


假設您正在檢視一個值表,例如上面的值表。您想要近似(獲得對 63 處值的良好估計),但您的表中沒有這些值。這裡一個好的解決方案是使用線性逼近來獲得一個可能接近您真正想要的值,而無需經歷計算表中額外步驟的所有麻煩。

這僅僅是將直線方程應用於資料表。xi 表示您想要了解的資料點, 是您想要了解的點下方已知資料點,而 是您想要了解的點上方已知資料點。

例子

[edit | edit source]

使用上面的表格,找到 0.05 列中 63 處的值。

首先,我們在上面的表中確認我們需要對該值進行近似。如果我們準確地知道它,那麼實際上就沒有必要對它進行近似。就目前而言,它將位於表中 60 和 70 之間的位置。其他一切都可以從表中獲得。

 

 

使用軟體,我們計算出 *f*(63) 的實際值為 1.669402,與之相差約 0.00013。對於我們的目的來說,這已經足夠接近了。

華夏公益教科書