統計學/多元資料分析/主成分分析
外觀
在主成分分析(PCA)中,從資料建立新的座標系。這個新座標系的原點是總均值,即每個變數的均值在轉換後的座標系中變為 0。第一個主成分(第一軸)沿著資料的最大延伸方向延伸。想象你的資料是三個變數,x1、x2 和 x3。資料在三維空間中形成資料雲,例如像一個圓麵包。然後第一個軸 (p1) 可以被視覺化為一根穿過圓麵包最大尺寸的針。第二個軸 (p2) 與第一個軸正交,沿著圓麵包的下一個最長邊延伸。如前所述,原點,即兩個軸的交點,是均值。因此,兩個軸在圓麵包的重心(假設密度均勻)處相遇。第三個軸同樣與前兩個軸正交。在我們這個 3D 例子中,你可以很容易地算出,只有一種可能性了。
任何舊變數值的組合(例如 x11、x21、x31)在轉換後的 PCA 系統中都會有新的值(p11、p21、p31)。但是現在座標向量 (p1.、p2. 和 p3.) 將是正交的且不相關的。