跳轉到內容

統計/摘要/四分位數

來自華夏公益教科書,開放書籍,開放世界

統計學


  1. 簡介
    1. 什麼是統計學?
    2. 現代統計學中的學科
    3. 為什麼我應該學習統計學? 0% developed
    4. 我需要了解什麼才能學習統計學?
  2. 不同型別的資料
    1. 原始資料和二手資料
    2. 定量資料和定性資料
  3. 資料收集方法
    1. 實驗
    2. 抽樣調查
    3. 觀察性研究
  4. 資料分析
    1. 資料清洗
    2. 移動平均
  5. 彙總統計
    1. 集中趨勢的度量
      1. 平均數、中位數和眾數
      2. 幾何平均數
      3. 調和平均數
      4. 算術平均數、幾何平均數和調和平均數之間的關係
      5. 幾何中位數
    2. 離散程度的度量
      1. 資料的範圍
      2. 方差和標準差
      3. 四分位數和四分位間距
      4. 分位數
  6. 資料顯示
    1. 條形圖
    2. 比較條形圖
    3. 直方圖
    4. 散點圖
    5. 箱線圖
    6. 餅圖
    7. 比較餅圖
    8. 象形圖
    9. 折線圖
    10. 頻率多邊形
  7. 機率
    1. 組合學
    2. 伯努利試驗
    3. 貝葉斯分析入門
  8. 分佈
    1. 離散分佈
      1. 均勻分佈
      2. 伯努利分佈
      3. 二項分佈
      4. 泊松分佈
      5. 幾何分佈
      6. 負二項分佈
      7. 超幾何分佈
    2. 連續分佈
      1. 均勻分佈
      2. 指數分佈
      3. 伽馬分佈
      4. 正態分佈
      5. 卡方分佈
      6. 學生t分佈
      7. F分佈
      8. 貝塔分佈
      9. 威布林分佈
  9. 統計假設檢驗
    1. 統計檢驗的目的
    2. 使用的形式化
    3. 不同型別的檢驗
    4. 單個均值的z檢驗
    5. 兩個均值的z檢驗
    6. 單個均值的t檢驗
    7. 兩個均值的t檢驗
    8. 配對t檢驗用於比較均值
    9. 單因素方差分析F檢驗
    10. 單個比例的z檢驗
    11. 兩個比例的z檢驗
    12. 在Microsoft Excel中檢驗比例A是否大於比例B
    13. 斯皮爾曼等級相關係數
    14. 皮爾遜積矩相關係數
    15. 卡方檢驗
      1. 多個比例的卡方檢驗
      2. 列聯表的卡方檢驗
    16. 分佈的近似
  10. 點估計100% developed  as of 12:07, 28 March 2007 (UTC) (12:07, 28 March 2007 (UTC))
    1. 無偏性
    2. 優良性的度量
    3. UMVUE
    4. 完備性
    5. 充分性和最小充分性
    6. 輔助性
  11. 練習題
    1. 彙總統計問題
    2. 資料顯示問題
    3. 分佈問題
    4. 資料檢驗問題
  12. 數值方法
    1. 基本線性代數和格拉姆-施密特正交化
    2. 無約束最佳化
    3. 分位數迴歸
    4. 統計軟體的數值比較
    5. Excel中的數值計算
    6. 統計/數值方法/隨機數生成
  13. 時間序列分析
  14. 多元資料分析
    1. 主成分分析
    2. 度量資料的因子分析
    3. 序數資料的因子分析
    4. 典型相關分析
    5. 判別分析
  15. 特定資料集的分析
    1. 結核病分析
  16. 附錄
    1. 作者
    2. 詞彙表
    3. 索引
    4. 連結

編輯此框

四分位數

[編輯 | 編輯原始碼]

資料集的四分位數是由中位數兩側的兩個邊界形成的,它們將資料集分成四個相等的部分。最低的 25% 的資料位於第一個四分位數值以下,也稱為下四分位數 (Q1)。中位數或第二個四分位數將資料集分成兩個相等的部分。最低的 75% 的資料集應該位於第三個四分位數以下,也稱為上四分位數 (Q3)。這三個數字是資料離散程度的度量,而平均數、中位數和眾數是集中趨勢的度量。

給定集合 {1, 3, 5, 8, 9, 12, 24, 25, 28, 30, 41, 50},我們將找到第一個和第三個四分位數如下

該集合中有 12 個元素,所以 12/4 給我們集合的每個四分之一有三個元素。

因此第一個或最低的四分位數是:5,第二個四分位數是中位數12,第三個或最高的四分位數是28

但是,有些人當遇到具有偶數元素(值)的集合時,仍然想要真正的中位數(或中間值),在中位數的兩側有相同數量的資料值(而不是 12,它有 5 個值小於它,6 個值大於它)。然後,該值是 12 和 24 的平均值,得出 18 作為真正中位數(它更接近平均值 19 2/3)。然後將相同的過程應用於較低的和較高的四分位數,得到6.51829。這隻有在資料包含偶數個元素且有偶數個相等分割的部分,或者奇數個元素且有奇數個相等分割的部分時才是一個問題。

四分位間距

[編輯 | 編輯原始碼]

四分位間距是一個統計量,它提供有關資料集的擴充套件資訊,並透過從第三個四分位數中減去第一個四分位數來計算,從而得到資料集中間一半的範圍,修剪掉最低和最高的四分位數。由於 IQR 完全不受資料中異常值的影響,因此它是比範圍更穩健的離散程度度量。

IQR = Q3 - Q1

另一個有用的分位數是五分位數,它將資料分成五個相等的部分。五分位數的優點是它有一箇中心部分,它在中位數的兩側都有邊界,可以用作平均組。在正態分佈中,五分位數的邊界在均值(或中位數)的兩側有±0.253*s 和±0.842*s 的邊界,其中 s 是樣本標準差。請注意,在正態分佈中,均值、中位數和眾數重合。

其他常用的分位數是十分位數(10 個相等的部分)和百分位數(100 個相等的部分)

華夏公益教科書