代數/第 1 章/統計學
1.10: 統計學導論
以下三個數字代表了考慮資料集的平均值的三種不同方式。
平均數 - 這是我們通常認為的資料集的“平均值”。平均數可以透過將資料集中所有值求和併除以資料集的大小(即集合中元素的數量)來找到。在數學符號中,
例如:假設 1, 2, 4, 6, 8, 9 是我們的資料集,則總和為 1 + 2 + 4 + 6 + 8 + 9 = 30,並且資料集中有 6 個元素,因此平均數為 30/6 = 5。
平均數雖然是一個非常有用的統計量,但也有其缺陷。值得注意的是,它的值可能會受到異常值的嚴重影響 - 資料集中比大多數資料明顯更高或更低的值。對於此類資料集,通常最好使用中位數來描述。
中位數 - 這是我們資料集的中間值。要找到中位數,您必須首先將資料值按數值順序排列(例如,從小到大)。如果您的資料集中有奇數個元素,則中間只有一個數字,這個數字就是中位數。如果您的資料集中有偶數個元素,則中位數是中間兩個數字的平均值。例如:如果我們的資料集是 2, 2, 3, 4, 4, 5, 6, 7, 8, 9, 12, 13, 16, 22 是我們的資料集。因為它有偶數個元素,我們必須取中間兩個的平均值,在本例中是 6 和 7,因此中位數是 6.5。
眾數 - 眾數指的是一個或多個數字在一個數據集中出現的次數。由於平均數、中位數和眾數經常被混淆,記住眾數的一個簡單方法是“最常出現”。眾數的前兩個字母是“m”和“o”,想象它們代表“最常出現”以幫助您記住。如果兩個或更多個不同的值在重複次數上並列第一,則稱該資料集具有多個眾數。如果您被要求找到具有多個眾數的資料集的眾數,則應列出所有眾數。如果資料集中的元素沒有重複,則沒有眾數。
例如:假設 1, 2, 2, 2, 3, 3, 4, 5, 5, 5, 7 是我們的資料集,則眾數將是 2 和 5。它們都出現了三次,而三次是資料集中最大的重複次數。
以下數量告訴我們資料集的離散程度。
極差 - 資料集中最大和最小數字之間的差。請注意,這意味著極差永遠不會為負。
平均數
讓我們看一下以下資料集
資料值:10, 13, 4, 7, 9 因此 n = 5
現在將這些值加在一起
10 + 13 + 4 + 7 + 9 = 43
43 / 5 = 8.6
平均數 = 8.6
中位數
情況 1
資料值:10, 13, 4, 7, 8 因此 n = 5
數值順序:4, 7, 8, 13, 10
由於 8 是中間的數字,
中位數 = 8
情況 2
資料值:10, 13, 4, 7, 8, 10 因此 n = 6
數值順序:4, 7, 8, 10, 10, 13
中間數字:8 和 10
求平均數:8 + 10 = 18
18 / 2 = 9
中位數 = 9
眾數
資料值:10, 13, 4, 7, 8, 10
10 在資料集中出現了兩次。
眾數 = 10
資料值:4, 9, 13, 18, 4, 2, 9, 4, 13, 8, 9
4 和 9 都具有三個資料值。
眾數 = 4, 9
極差
資料值:10, 13, 4, 7, 8
數值順序:4, 7, 8, 10, 13
最後一個和第一個的差:13 - 4 = 9
極差 = 9