跳轉到內容

線性代數/奇異值分解

來自華夏公益教科書,自由的教科書,共建自由的世界

奇異值分解

[編輯 | 編輯原始碼]

對於任何矩陣,奇異值分解 (SVD) 是,其中 是一個 酉矩陣, 是一個 酉矩陣, 是一個 對角矩陣,所有非對角元素均為 0,對角元素均為非負實數。 的對角元素被稱為“奇異值”。

例如,考慮剪下變換 的奇異值分解是

所有單位長度向量,使得 形成一個半徑為 1 的球體,圍繞原點。當 應用於該球體時,它將變成一個橢球體。該橢球體的半長軸就是奇異值,它們的方位形成 的列向量。


奇異值分解的存在性

[編輯 | 編輯原始碼]

一個不那麼顯而易見的事實是奇異值分解總是存在的

定理(奇異值分解的存在性)

給定任意 矩陣,存在 酉矩陣 酉矩陣 對角矩陣,其中所有非對角線元素為 0,對角線元素均為非負實數,使得.

本質上,任何線性變換都是一個旋轉,然後是沿著每個軸的拉伸或收縮(某些維度被新增或歸零),最後是另一個旋轉。

下面的證明將證明奇異值分解總是存在的。首先將給出證明的提綱

證明提綱

我們需要證明任意線性變換 是一個旋轉:,然後是沿著每個軸的縮放:,最後是另一個旋轉:,得到.

如果 的列向量已經是相互正交的,那麼第一個旋轉就不需要: 的元素是 的列向量形成的向量的長度, 是一個旋轉,它將 的基本基向量旋轉到與 的列向量平行。

In most cases however, the columns of are not mutually orthogonal. In this case, the rotation is non-trivial. , so must be chosen so that the columns of are mutually orthogonal. Let . We need to choose orthonormal vectors so that are all mutually orthogonal. This can be done iteratively. Imagine that we have chosen so that when given any vector that is orthogonal to , that is orthogonal to . The effort now switches to finding an orthonormal set of vectors confined to the space of vectors that are perpendicular to such that are mutually orthogonal.

為一個酉矩陣,其第一列為 。從 左側提取 ,這將產生一組新的正交向量,這些向量是 的列向量。我們的目標是使 的列向量相互正交,這轉化為使 的列向量相互正交,其中 有效地替代了 變換為 ,並且與 正交的向量空間變換為由標準基向量 張成的空間。 的第一列是 ,因此它與所有其他列向量正交。

如果 是一個酉矩陣,其中 的第一列是 歸一化為單位長度,那麼從 的左側提取 得到 會得到一個矩陣,其第一列與標準基向量 平行。 的第一列與所有其他列正交,因此 的第一列與所有其他列正交,因此 的第一行除了第一列之外,其餘都包含 0。

現在可以透過遞迴地確定,維度降低到 被替換為 ,並刪除第一行和第一列。 這形成了即將到來的證明的歸納部分。

最後,我們如何知道存在,使得當給定任何與 正交的向量 時, 正交?答案是使得 最大化的單位長度 是一個有效的

現在我們準備給出完整的證明細節

奇異值分解存在性的證明

本證明將使用關於 的歸納法進行。

基本情況

只有一個行,因此具有形式 ,其中 是一個任意的單位長度向量,而 是一個任意的非負實數。注意,對於任何單行矩陣 都是存在的。

,和 ,其中 共同構成一個長度為 1 的互相正交的向量集。 可以透過 Gram-Schmidt 正交化方法確定。很明顯:.

基本情況

只有一個列,因此具有形式 ,其中 是一個任意的長度為 1 的向量,而 是一個任意的非負實數。請注意,對於任何單列矩陣 都存在。

,以及 ,其中 共同構成一組相互正交的單位長度向量。 可以透過格拉姆-施密特正交化來確定。 很明顯:

歸納情況

表示 的第 個標準基向量。 令 表示一個 的零矩陣。

在約束條件 下,最大化 。令 為最大化 的單位長度向量,並令 。令 (如果 ,那麼 是一個任意的單位長度向量)。

使用格拉姆-施密特正交化,可以確定酉矩陣 ,使得 的第一列分別為 其中 。現在將證明 的第一列和第一行除了 (1,1) 位置的元素為 外,其餘元素均為 0:.

。這意味著 的第一列是

為了說明 的第一行是 ,我們將證明 的第一列與 的所有其他列正交。這將需要利用以下事實:在約束條件 下, 使 最大化。

是一個引數化的單位長度向量。令

對約束條件 求導得到

處取得最大值,得到

( 分別表示複數的實部和虛部。)

為任意值。令 是正交的。

這給出了:

現在令 ,其中下標外的 是虛數單位。 是正交的。

這給出了:

因此:

因此, 的第一列與 的所有其他列正交,並且 具有以下形式:

是一個 矩陣,因此,透過歸納推理,。最後,

其中 ,和 .


華夏公益教科書