跳轉到內容

代數/第 1 章/統計學

來自華夏公益教科書,開放的書籍,開放的世界
代數/第 1 章
 ← 機率 統計學

1.10: 統計學導論


集中趨勢和離散程度的度量

[編輯 | 編輯原始碼]

以下三個數字代表了考慮資料集的平均值的三種不同方式。

平均數 - 這是我們通常認為的資料集的“平均值”。平均數可以透過將資料集中所有值求和併除以資料集的大小(即集合中元素的數量)來找到。在數學符號中,

例如:假設 1, 2, 4, 6, 8, 9 是我們的資料集,則總和為 1 + 2 + 4 + 6 + 8 + 9 = 30,並且資料集中有 6 個元素,因此平均數為 30/6 = 5

平均數雖然是一個非常有用的統計量,但也有其缺陷。值得注意的是,它的值可能會受到異常值的嚴重影響 - 資料集中比大多數資料明顯更高或更低的值。對於此類資料集,通常最好使用中位數來描述。

中位數 - 這是我們資料集的中間值。要找到中位數,您必須首先將資料值按數值順序排列(例如,從小到大)。如果您的資料集中有奇數個元素,則中間只有一個數字,這個數字就是中位數。如果您的資料集中有偶數個元素,則中位數是中間兩個數字的平均值。例如:如果我們的資料集是 2, 2, 3, 4, 4, 5, 6, 7, 8, 9, 12, 13, 16, 22 是我們的資料集。因為它有偶數個元素,我們必須取中間兩個的平均值,在本例中是 6 和 7,因此中位數是 6.5。

眾數 - 眾數指的是一個或多個數字在一個數據集中出現的次數。由於平均數、中位數和眾數經常被混淆,記住眾數的一個簡單方法是“最常出現”。眾數的前兩個字母是“m”和“o”,想象它們代表“最常出現”以幫助您記住。如果兩個或更多個不同的值在重複次數上並列第一,則稱該資料集具有多個眾數。如果您被要求找到具有多個眾數的資料集的眾數,則應列出所有眾數。如果資料集中的元素沒有重複,則沒有眾數。

例如:假設 1, 2, 2, 2, 3, 3, 4, 5, 5, 5, 7 是我們的資料集,則眾數將是 2 和 5。它們都出現了三次,而三次是資料集中最大的重複次數。

以下數量告訴我們資料集的離散程度。

極差 - 資料集中最大和最小數字之間的差。請注意,這意味著極差永遠不會為負。


平均數

讓我們看一下以下資料集

資料值:10, 13, 4, 7, 9 因此 n = 5

現在將這些值加在一起

10 + 13 + 4 + 7 + 9 = 43

   43 / 5 = 8.6

平均數 = 8.6


中位數

情況 1

資料值:10, 13, 4, 7, 8 因此 n = 5

數值順序:4, 7, 8, 13, 10

由於 8 是中間的數字,

中位數 = 8

情況 2

資料值:10, 13, 4, 7, 8, 10 因此 n = 6

數值順序:4, 7, 8, 10, 10, 13

中間數字:8 和 10

求平均數:8 + 10 = 18

          18 / 2 = 9

中位數 = 9


眾數

資料值:10, 13, 4, 7, 8, 10

10 在資料集中出現了兩次。

眾數 = 10

資料值:4, 9, 13, 18, 4, 2, 9, 4, 13, 8, 9

4 和 9 都具有三個資料值。

眾數 = 4, 9


極差

資料值:10, 13, 4, 7, 8

數值順序:4, 7, 8, 10, 13

最後一個和第一個的差:13 - 4 = 9

極差 = 9


找出以下資料集的平均數、中位數、眾數和極差
5, 8, 12, 4, 8, 9, 11, 2

1

平均數 =

2

中位數 =

3

眾數 =

4

極差 =

24, 26, 37, 24, 16, 44, 26, 34, 24

5

平均數 =

6

中位數 =

7

眾數 =

8

極差 =

15, 48, 89, 74, 25, 36, 57, 51, 17, 22

9

平均數 =

10

中位數 =

11 有多少個眾數?

12

極差 =

2, 6, 8, 7, 8, 2, 2, 9, 10

13

平均數 =

14

中位數 =

15

眾數 =

16

極差 =

華夏公益教科書