使用 SPSS 和 PASW/瞭解度量列
主流統計學識別四個度量水平或尺度。 它們是
- 名義
- 順序
- 區間
- 比率(在 SPSS 中與區間資料組合為比例)
這些按從最像名稱到最像數字的順序排列。 每個級別都有其自身的特徵,並且與一組允許的統計程式相關聯。 下面,將對該級別進行表徵並與一個或多個集中趨勢度量相關聯,即,眾數、平均數和中位數。
名義度量水平用於分類資料,其中每個值都被分配給一個離散類別。 例如,研究中參與者的眼睛顏色可以按名義(來自拉丁語nomen,意思是名稱)分類為以下幾組
- 棕色
- 藍色
- 綠色
- 其他
這些資料定量分析的唯一過程是計數,以發現出現頻率。 也就是說,有多少個人被分配到每個類別。 類別通常用數字編碼(即,分配一個唯一的數字)並命名(使用變數的值屬性)。
名義資料的唯一集中趨勢度量是眾數,它是出現頻率最高的類別。 請注意,樣本不保證會產生唯一的眾數值。
順序度量水平用於形成離散類別並且可以在某個尺度上自然排名的資料。 此排名是對資料的弱排序,因為兩個值可以共享相同的排名:a 和b 的相對排名是
- a < b 或
- a > b 或
- a = b
這完全錯誤,請勿使用,因為在 2018 年 11 月 11 日它是不正確的。
順序資料的示例是收入分組。 雖然收入可以被視為標量變數,但在將收入範圍劃分為類別通常很有用。 例如,國家統計局建議使用以下分組[1]
| 收入範圍下限 | 收入範圍上限 | 可能的帶程式碼 |
|---|---|---|
| 資料中的最低值 | £5,199 | 1 |
| £5,200 | £10,399 | 2 |
| £10,400 | £15,599 | 3 |
| £15,600 | £20,799 | 4 |
| £20,800 | £25,999 | 5 |
| £26,000 | £31,199 | 6 |
| £31,200 | £36,399 | 7 |
| £36,400 | £51,999 | 8 |
(我可能會新增第九個帶以處理所有收入超過 £51,999 的情況)
與名義資料一樣,這些分組也可以用數字程式碼表示。
順序資料的集中趨勢可以用眾數(上面已定義)和中位數表示,它是將資料分成兩半的值。 這是案例數量為奇數時的中間值。 否則,中位數通常取為兩個中間值的算術平均數(見下文)。
此尺度上排名級別之間的差異無法測量或比較:雖然我們知道,對於順序資料點 a、b 和 c,a<b、b<c 和 a<c,但我們不知道距離 ab 是否等於距離 bc。
區間資料值可以排序,並且可以比較它們之間的距離。 但是,區間資料的零點是任意的。 經常被引用的示例是攝氏溫標上的溫度測量。 在這裡,水的冰點被任意地分配為零,水的沸點被任意地分配為 100。 雖然 50° 在尺度上這兩個標記之間指示為一半,但它並不合理地是水沸點的一半。 例如,您不能透過將指示的烤箱溫度減半並將烹飪時間加倍來合理地修改食譜。
比率資料都是:有序的,具有可比較的距離(尺度上的連續積分點等距),並且在具有真實零點的尺度上。
例如,考慮用米測量高度:有些物體沒有海拔,這自然對映到零米的高度。
這些值也可以形成比率,因此任何值都可以表示為其他值的比率。 例如,如果我們找到三個身高分別為 1.5 米、1.75 米和 2 米的人,我們可以將其中任何一個表示為另一個人的倍數。
比例資料的集中趨勢可以用眾數、中位數和算術平均數表示。
前兩個在上面討論過。
算術平均數是所有資料值的總和除以資料點數。 換句話說,它就是通常所說的平均數。
- ↑ Stevens, S. S. "Harmonised Concepts and Questions for Social Data Sources: Secondary Standards" (PDF).
{{cite journal}}: Cite journal requires|journal=(help); line feed character in|title=at position 59 (help)