跳轉到內容

統計/摘要/範圍

來自華夏公益教科書,開放的書籍,面向開放的世界
(重定向自 統計:摘要/範圍)

統計


  1. 介紹
    1. 什麼是統計學?
    2. 現代統計學中的主題
    3. 為什麼我應該學習統計學? 0% developed
    4. 學習統計學需要了解什麼?
  2. 不同型別的資料
    1. 原始資料和二手資料
    2. 定量資料和定性資料
  3. 資料收集方法
    1. 實驗
    2. 抽樣調查
    3. 觀察性研究
  4. 資料分析
    1. 資料清洗
    2. 移動平均
  5. 彙總統計
    1. 集中趨勢測量
      1. 平均數、中位數和眾數
      2. 幾何平均數
      3. 調和平均數
      4. 算術、幾何和調和平均數之間的關係
      5. 幾何中位數
    2. 離散程度測量
      1. 資料範圍
      2. 方差和標準差
      3. 四分位數和四分位數範圍
      4. 分位數
  6. 資料展示
    1. 條形圖
    2. 比較條形圖
    3. 直方圖
    4. 散點圖
    5. 箱線圖
    6. 餅圖
    7. 比較餅圖
    8. 象形圖
    9. 折線圖
    10. 頻率多邊形
  7. 機率
    1. 組合學
    2. 伯努利試驗
    3. 貝葉斯分析入門
  8. 分佈
    1. 離散分佈
      1. 均勻分佈
      2. 伯努利分佈
      3. 二項分佈
      4. 泊松分佈
      5. 幾何分佈
      6. 負二項分佈
      7. 超幾何分佈
    2. 連續分佈
      1. 均勻分佈
      2. 指數分佈
      3. 伽馬分佈
      4. 正態分佈
      5. 卡方分佈
      6. 學生t分佈
      7. F分佈
      8. 貝塔分佈
      9. 威布林分佈
  9. 檢驗統計假設
    1. 統計檢驗的目的
    2. 使用的形式主義
    3. 不同型別的檢驗
    4. 單樣本z檢驗
    5. 雙樣本z檢驗
    6. 單樣本t檢驗
    7. 雙樣本t檢驗
    8. 配對t檢驗用於比較均值
    9. 單因素方差分析F檢驗
    10. 單樣本比例z檢驗
    11. 雙樣本比例z檢驗
    12. 在 Microsoft Excel 中檢驗比例 A 是否大於比例 B
    13. 斯皮爾曼等級相關係數
    14. 皮爾遜積矩相關係數
    15. 卡方檢驗
      1. 多個比例的卡方檢驗
      2. 列聯表的卡方檢驗
    16. 分佈的近似值
  10. 點估計100% developed  as of 12:07, 28 March 2007 (UTC) (12:07, 28 March 2007 (UTC))
    1. 無偏性
    2. 優良性測量
    3. UMVUE
    4. 完備性
    5. 充分性和最小充分性
    6. 輔助性
  11. 練習題
    1. 彙總統計問題
    2. 資料展示問題
    3. 分佈問題
    4. 資料檢驗問題
  12. 數值方法
    1. 基本線性代數和格拉姆-施密特正交化
    2. 無約束最佳化
    3. 分位數迴歸
    4. 統計軟體的數值比較
    5. Excel 中的數值
    6. 統計/數值方法/隨機數生成
  13. 時間序列分析
  14. 多元資料分析
    1. 主成分分析
    2. 度量資料的因子分析
    3. 序數資料的因子分析
    4. 典型相關分析
    5. 判別分析
  15. 特定資料集的分析
    1. 結核病分析
  16. 附錄
    1. 作者
    2. 詞彙表
    3. 索引
    4. 連結

編輯此框

資料範圍

[編輯 | 編輯原始碼]

樣本(資料集)的範圍僅僅是資料中可能的最大差異,即最大值和最小值之間的差異。一個更準確的術語是“範圍寬度”,通常用字母 R 或 w 表示。這兩個單獨的值(最大值和最小值)被稱為“範圍限制”。通常這些術語會混淆,學生應該注意使用正確的術語。

例如,在一個樣本中,值分別為 2 3 5 7 8 11 12,範圍是 11 (|12|-|2|+1=11),範圍限制是 2 和 12。

範圍是資料集中離散程度(分佈)最簡單、最容易理解的測量,儘管它在日常生活中被廣泛使用,但對於嚴肅的統計工作來說,它過於粗糙。它不是一個“穩健”的度量,因為顯然,從總體中找到最大值和最小值的機率很大程度上取決於我們從總體中選擇樣本的大小,因此它的值很可能在不同的樣本之間有很大的差異。此外,它不是一個令人滿意的描述符,因為它只依賴於樣本中的兩個專案,忽略了所有其他專案。一個更好的離散程度測量是標準差(s),它考慮了所有資料。它不僅比範圍更穩健、更“有效”,而且也更容易進行更廣泛的統計操作。然而,範圍在對資料的簡單描述以及質量控制圖表中仍然經常使用。

然而,一組資料的平均範圍是一個非常有效的度量(統計量),可以用作計算s的簡便方法。在這種情況下,我們將資料細分為幾組,計算它們的平均範圍,,並將其除以一個係數(來自表格),該係數取決於 n。例如,在化學實驗室中,非常普遍的做法是對樣本進行重複分析,因此他們擁有大量現成資料來計算s

(要使用的係數 k 在標準差下給出)

例如:如果我們有一個大小為 40 的樣本,我們可以將其分為 10 個 n=4 的子樣本。如果我們然後發現它們的平均範圍為 3.1,那麼 40 個專案的母樣本的標準差約為 3.1/2.059 = 1.506。

現在,隨著簡單的電子計算器的出現,它們可以透過按一個鍵直接計算s,因此不再需要這種權宜之計,儘管統計學學生應該熟悉它們。

{tBookCat}}

華夏公益教科書