跳轉到內容

使用 SPSS 和 PASW/理解缺失值對話方塊

來自華夏公益教科書,開放的書,為開放的世界

缺失值的編碼

[編輯 | 編輯原始碼]

關於缺失資料的處理有很多文獻(例如,參見 Allison (2001) 以獲取參考文獻[1]),我不想在這裡處理方法論問題。相反,我想更詳細地解釋缺失值對話方塊。以下是對話方塊

請注意,您可以指定最多三個離散整數或字串值,或一個範圍,來代表缺失資料。如果您想分析資料中存在的缺失值,您可能希望使用多個指標(例如,您可能有“隨機缺失”、“完全隨機缺失”和“非隨機缺失”的選擇),但如果您只對消除這些情況(資料點)感興趣,那麼一個指標就足夠了。

請注意,如果您的變數是數值型,那麼您用於指示缺失資料的程式碼也必須是數值型。

在可能的情況下,選擇一個缺失值程式碼,該程式碼作為該變數的測量值在邏輯上不可能。例如,年齡為 -1。您可能考慮使用 999 作為年齡的缺失程式碼,因為它是不可能的年齡,但最好指定不可能的而不是不太可能的。對於字串變數,您可以使用任何字串,例如,NA 代表不適用,或簡單的缺失

在您在變數檢視中完成缺失值對話方塊後,您仍然需要輸入資料,因為變數的預設缺失值不會是您的缺失值。相反,它將是數值變數的系統缺失(用句號表示),以及字串變數的空格。

如果您只有幾個缺失例項,您可以手動執行此操作。首先,按相關變數對資料進行排序,以便空單元格首先出現,從而方便任務執行。

但是,如果您有大量的缺失資料點,那麼使用轉換 → 重新編碼為同一變數對話方塊重新編碼系統缺失資料會更容易。對於數值變數,在對話方塊的左側,選擇系統缺失作為舊值,在右側,選擇您的缺失程式碼作為新值。對於字串資料,您將輸入空格,而不是系統缺失作為舊值。

  1. Allison, P. D. ((2001).). 缺失資料. Thousand Oaks, CA: Sage Publications. {{引用書籍}}: 檢查日期值:|date= (幫助)
華夏公益教科書