代數/第 1 章/統計學
1.10:統計學導論
以下三個數字代表了三種不同的思考資料集平均值的方法。
平均數 - 這是我們通常認為的資料集的“平均值”。平均數可以透過將資料集中的所有值相加併除以資料集的大小(即集合中的元素數量)來找到。在數學符號中,
例如:假設 1, 2, 4, 6, 8, 9 是我們的資料集,那麼總和是 1 + 2 + 4 + 6 + 8 + 9 = 30,資料集中有 6 個元素,所以平均數是 30/6 = 5。
平均數雖然是一個非常有用的統計量,但也存在缺陷。值得注意的是,它的值可能會受到異常值的很大影響——資料集中的數字明顯高於或低於大多數資料。通常情況下,最好使用中位數來描述此類資料集。
中位數 - 這是我們資料集的中間值。要找到中位數,您必須首先將資料值按數值順序排列(例如,從小到大)。如果您在資料集中有奇數個元素,那麼中間將只有一個數字,這個數字就是中位數。如果您在資料集中有偶數個元素,那麼中位數是中間兩個數字的平均值。例如。如果我們的資料集是 2, 2, 3, 4, 4, 5, 6, 7, 8, 9, 12, 13, 16, 22,那麼它就是我們的資料集。因為它有偶數個元素,所以我們必須取中間兩個的平均值,在本例中是 6 和 7,所以中位數是 6.5。
眾數 - 眾數指的是一個數字或多個數字在一個數據集中出現的次數。由於平均數、中位數和眾數經常被混淆,所以記住眾數的一個簡單方法是“最常出現”。眾數的前兩個字母是“m”和“o”,想象它代表“最常出現”,這將有助於您記住。如果兩個或多個不同的值出現次數最多相同,則該資料集被稱為有多個眾數。如果要求您找到有多個眾數的資料集的眾數,則應列出所有眾數。如果資料集中的任何元素都沒有重複,則沒有眾數。
例如。假設 1, 2, 2, 2, 3, 3, 4, 5, 5, 5, 7 是我們的資料集,那麼眾數將是 2 和 5。它們都出現了三次,而 3 是我們資料集中重複的最大次數。
以下數量告訴我們資料集的離散程度。
極差 - 資料集中最大數字和最小數字之間的差值。請注意,這意味著極差永遠不會是負數。
平均數
讓我們看看以下資料集
資料值:10, 13, 4, 7, 9,所以 n = 5
現在將這些值加在一起
10 + 13 + 4 + 7 + 9 = 43
43 / 5 = 8.6
平均數 = 8.6
中位數
情況 1
資料值:10, 13, 4, 7, 8,所以 n = 5
數值順序:4, 7, 8, 13, 10
由於 8 是中間數字,
中位數 = 8
情況 2
資料值:10, 13, 4, 7, 8, 10,所以 n = 6
數值順序:4, 7, 8, 10, 10, 13
中間數字:8 和 10
求平均數:8 + 10 = 18
18 / 2 = 9
中位數 = 9
眾數
資料值:10, 13, 4, 7, 8, 10
10 在資料集中出現了兩次。
眾數 = 10
資料值:4, 9, 13, 18, 4, 2, 9, 4, 13, 8, 9
4 和 9 都具有三個資料值。
眾數 = 4, 9
極差
資料值:10, 13, 4, 7, 8
數值順序:4, 7, 8, 10, 13
最後一個數字和第一個數字的差值:13 - 4 = 9
極差 = 9