跳轉至內容

統計學/概要/範圍

來自華夏公益教科書

統計學


  1. 介紹
    1. 什麼是統計學?
    2. 現代統計學主題
    3. 為什麼我要學習統計學? 0% 開發完成
    4. 我需要知道什麼才能學習統計學?
  2. 不同型別的資料
    1. 初級和次級資料
    2. 定量和定性資料
  3. 資料收集方法
    1. 實驗
    2. 抽樣調查
    3. 觀察研究
  4. 資料分析
    1. 資料清洗
    2. 移動平均
  5. 彙總統計量
    1. 集中趨勢的度量
      1. 平均數、中位數和眾數
      2. 幾何平均數
      3. 調和平均數
      4. 算術平均數、幾何平均數和調和平均數之間的關係
      5. 幾何中位數
    2. 離散程度的度量
      1. 資料範圍
      2. 方差和標準差
      3. 四分位數和四分位距
      4. 分位數
  6. 資料顯示
    1. 條形圖
    2. 比較條形圖
    3. 直方圖
    4. 散點圖
    5. 箱線圖
    6. 餅圖
    7. 比較餅圖
    8. 象形圖
    9. 折線圖
    10. 頻數多邊形
  7. 機率
    1. 組合學
    2. 伯努利試驗
    3. 貝葉斯分析入門
  8. 分佈
    1. 離散分佈
      1. 均勻分佈
      2. 伯努利分佈
      3. 二項分佈
      4. 泊松分佈
      5. 幾何分佈
      6. 負二項分佈
      7. 超幾何分佈
    2. 連續分佈
      1. 均勻分佈
      2. 指數分佈
      3. 伽馬分佈
      4. 正態分佈
      5. 卡方分佈
      6. 學生t分佈
      7. F分佈
      8. 貝塔分佈
      9. 威布林分佈
  9. 檢驗統計假設
    1. 統計檢驗的目的
    2. 使用的形式主義
    3. 不同型別的檢驗
    4. 單樣本z檢驗
    5. 雙樣本z檢驗
    6. 單樣本t檢驗
    7. 雙樣本t檢驗
    8. 配對樣本t檢驗
    9. 單因素方差分析F檢驗
    10. 單樣本比例z檢驗
    11. 雙樣本比例z檢驗
    12. 在 Microsoft Excel 中檢驗比例 A 是否大於比例 B
    13. 斯皮爾曼等級相關係數
    14. 皮爾遜積矩相關係數
    15. 卡方檢驗
      1. 多樣本比例卡方檢驗
      2. 列聯表卡方檢驗
    16. 分佈的近似
  10. 點估計100% 開發完成  截至 2007 年 3 月 28 日 12:07 (UTC) (2007 年 3 月 28 日 12:07 (UTC))
    1. 無偏性
    2. 優良性指標
    3. UMVUE
    4. 完備性
    5. 充分性與最小充分性
    6. 輔助性
  11. 練習題
    1. 彙總統計量問題
    2. 資料顯示問題
    3. 分佈問題
    4. 資料檢驗問題
  12. 數值方法
    1. 基本線性代數和格拉姆-施密特正交化
    2. 無約束最佳化
    3. 分位數迴歸
    4. 統計軟體的數值比較
    5. Excel 中的數值
    6. 統計學/數值方法/隨機數生成
  13. 時間序列分析
  14. 多元資料分析
    1. 主成分分析
    2. 度量資料的因子分析
    3. 序數資料的因子分析
    4. 典型相關分析
    5. 判別分析
  15. 特定資料集的分析
    1. 結核病分析
  16. 附錄
    1. 作者
    2. 詞彙表
    3. 索引
    4. 連結

編輯此框

資料範圍

[編輯 | 編輯原始碼]

樣本(資料集)的範圍只是資料中可能的最大差異,即最大值和最小值之間的差異。更準確的術語是“範圍寬度”,通常用字母 R 或 w 表示。這兩個單獨的值(最大值和最小值)稱為“範圍限”。通常這些術語會被混淆,學生應該注意使用正確的術語。

例如,在一個樣本中,值分別為 2 3 5 7 8 11 12,則範圍是 11(|12|-|2|+1=11),範圍限是 2 和 12。

範圍是理解資料離散程度(散佈)最簡單、最容易理解的度量,雖然它在日常生活中被廣泛使用,但對於嚴肅的統計工作來說太粗略了。它不是一個“穩健”的度量,因為顯然在總體中找到最大值和最小值的可能性很大程度上取決於我們從總體中選擇的樣本大小,因此它的值可能在一個樣本到另一個樣本之間有很大的差異。此外,它不是資料的令人滿意的描述符,因為它僅依賴於樣本中的兩個專案,而忽略了所有其他專案。離散程度的一個好得多的度量是標準差(s),它考慮了所有資料。它不僅比範圍更穩健和“有效”,而且還適用於更廣泛的統計操作。然而,範圍仍然廣泛用於對資料的簡單描述,以及在質量控制圖中。

然而,一組資料的平均範圍是一個相當有效的度量(統計量),可以用作計算s的簡便方法。在這種情況下,我們所做的是將資料細分為幾個成員組,計算它們的平均範圍,,並將其除以一個取決於 n 的係數(來自表格)。例如,在化學實驗室中,分析樣本通常是成對進行的,因此它們有大量現成資料來計算s

(使用的係數 k 在標準差下給出。)

例如:如果我們有一個大小為 40 的樣本,我們可以將其細分為 10 個子樣本,每個子樣本的大小為 n=4。如果我們發現它們的平均範圍是,比如說,3.1,那麼包含 40 個專案的父樣本的標準差大約為 3.1/2.059 = 1.506。

現在有簡單的電子計算器可用,它們只需按一下鍵就可以直接計算s,因此不再需要這樣的權宜之計,儘管統計學學生應該熟悉它們。

{tBookCat}

華夏公益教科書