統計學/概要/範圍
樣本(資料集)的範圍只是資料中可能的最大差異,即最大值和最小值之間的差異。更準確的術語是“範圍寬度”,通常用字母 R 或 w 表示。這兩個單獨的值(最大值和最小值)稱為“範圍限”。通常這些術語會被混淆,學生應該注意使用正確的術語。
例如,在一個樣本中,值分別為 2 3 5 7 8 11 12,則範圍是 11(|12|-|2|+1=11),範圍限是 2 和 12。
範圍是理解資料離散程度(散佈)最簡單、最容易理解的度量,雖然它在日常生活中被廣泛使用,但對於嚴肅的統計工作來說太粗略了。它不是一個“穩健”的度量,因為顯然在總體中找到最大值和最小值的可能性很大程度上取決於我們從總體中選擇的樣本大小,因此它的值可能在一個樣本到另一個樣本之間有很大的差異。此外,它不是資料的令人滿意的描述符,因為它僅依賴於樣本中的兩個專案,而忽略了所有其他專案。離散程度的一個好得多的度量是標準差(s),它考慮了所有資料。它不僅比範圍更穩健和“有效”,而且還適用於更廣泛的統計操作。然而,範圍仍然廣泛用於對資料的簡單描述,以及在質量控制圖中。
然而,一組資料的平均範圍是一個相當有效的度量(統計量),可以用作計算s的簡便方法。在這種情況下,我們所做的是將資料細分為幾個成員組,計算它們的平均範圍,,並將其除以一個取決於 n 的係數(來自表格)。例如,在化學實驗室中,分析樣本通常是成對進行的,因此它們有大量現成資料來計算s。
(使用的係數 k 在標準差下給出。)
例如:如果我們有一個大小為 40 的樣本,我們可以將其細分為 10 個子樣本,每個子樣本的大小為 n=4。如果我們發現它們的平均範圍是,比如說,3.1,那麼包含 40 個專案的父樣本的標準差大約為 3.1/2.059 = 1.506。
現在有簡單的電子計算器可用,它們只需按一下鍵就可以直接計算s,因此不再需要這樣的權宜之計,儘管統計學學生應該熟悉它們。
{tBookCat}