統計/摘要/範圍
樣本(資料集)的範圍僅僅是資料中可能的最大差異,即最大值和最小值之間的差異。一個更準確的術語是“範圍寬度”,通常用字母 R 或 w 表示。這兩個單獨的值(最大值和最小值)被稱為“範圍限制”。通常這些術語會混淆,學生應該注意使用正確的術語。
例如,在一個樣本中,值分別為 2 3 5 7 8 11 12,範圍是 11 (|12|-|2|+1=11),範圍限制是 2 和 12。
範圍是資料集中離散程度(分佈)最簡單、最容易理解的測量,儘管它在日常生活中被廣泛使用,但對於嚴肅的統計工作來說,它過於粗糙。它不是一個“穩健”的度量,因為顯然,從總體中找到最大值和最小值的機率很大程度上取決於我們從總體中選擇樣本的大小,因此它的值很可能在不同的樣本之間有很大的差異。此外,它不是一個令人滿意的描述符,因為它只依賴於樣本中的兩個專案,忽略了所有其他專案。一個更好的離散程度測量是標準差(s),它考慮了所有資料。它不僅比範圍更穩健、更“有效”,而且也更容易進行更廣泛的統計操作。然而,範圍在對資料的簡單描述以及質量控制圖表中仍然經常使用。
然而,一組資料的平均範圍是一個非常有效的度量(統計量),可以用作計算s的簡便方法。在這種情況下,我們將資料細分為幾組,計算它們的平均範圍,,並將其除以一個係數(來自表格),該係數取決於 n。例如,在化學實驗室中,非常普遍的做法是對樣本進行重複分析,因此他們擁有大量現成資料來計算s。
(要使用的係數 k 在標準差下給出)
例如:如果我們有一個大小為 40 的樣本,我們可以將其分為 10 個 n=4 的子樣本。如果我們然後發現它們的平均範圍為 3.1,那麼 40 個專案的母樣本的標準差約為 3.1/2.059 = 1.506。
現在,隨著簡單的電子計算器的出現,它們可以透過按一個鍵直接計算s,因此不再需要這種權宜之計,儘管統計學學生應該熟悉它們。
{tBookCat}}