線性代數/特徵值和特徵向量

特徵值和特徵向量與矩陣的基本屬性有關。

“特徵值”一詞來自德語“Eigenwert”，意思是“適當的或特徵的價值”。

動機

大型矩陣在計算時間方面可能很昂貴，並且可能需要進行數百或數千次迭代才能進行計算。此外，在沒有重要數學工具的情況下，矩陣的行為將難以探索。一個數學工具，不僅對線性代數有應用，而且對微分方程、微積分和許多其他領域也有應用，那就是特徵值和特徵向量的概念。特徵值和特徵向量基於線性系統中的常見行為。讓我們看一個例子。

讓

A={\begin{pmatrix}1&2\\0&-2\\\end{pmatrix}}

和

\mathbf {x} ={\begin{pmatrix}-2\\3\\\end{pmatrix}},\quad \mathbf {y} ={\begin{pmatrix}1\\0\\\end{pmatrix}}.

如果A轉換x和y會發生什麼？好吧，

A\mathbf {x} ={\begin{pmatrix}4\\-6\\\end{pmatrix}}

A\mathbf {y} ={\begin{pmatrix}1\\0\\\end{pmatrix}}

但值得注意的是

A\mathbf {x} =(-2){\begin{pmatrix}-2\\3\\\end{pmatrix}}=-2\mathbf {x}

A\mathbf {y} =(1){\begin{pmatrix}1\\0\\\end{pmatrix}}=\mathbf {y} =(1)\mathbf {y}

因此，當我們用矩陣A對向量x進行操作時，我們不會得到一個不同的向量（就像我們通常做的那樣），而是得到相同的向量x乘以某個常數。向量y也是如此。

我們將值 1 和 -2 稱為矩陣A的特徵值，而向量x和y稱為矩陣A的特徵向量。

定義

我們現在將這種矩陣/向量乘積與上面標量乘積相同的概念推廣：本質上，如果我們有一個n×n矩陣 A，我們在v中尋找解以找到特徵向量，並在λ中尋找解以找到方程的特徵值

Av=λv

我們該怎麼做呢？讓我們重新排列方程

Av-λv=0

(A-λI)v=0（注意我們必須將標量乘以單位矩陣，否則 A-λ 毫無意義）

但是 (A-λI) 是一個矩陣，所以我們試圖解決 Bv=0，其中 B=(A-λI)，而這個解僅僅是 B 的核，ker B。因此，特徵向量位於 ker (A-λI) 中，其中 λ 是一個特徵值。但我們如何找到特徵值呢？

Bv=0 具有非零解，如果 |B| = det(B) 為零。因此，為了找到特徵值，我們讓 |A-λI|=0，然後求解 λ。因此，我們將獲得一個關於複數的多項式方程（特徵值可以是複數），稱為特徵方程。特徵方程的根是特徵值。

注意，我們排除0 作為特徵向量，因為它平凡地是 Av=λv 的解，而且實際上我們並不關心它。此外，如果將零向量包括在內，它將允許無限多個特徵值，因為 λ 的任何值都滿足 A0=λ0。

如果我們有一個矩陣 A 的特徵值 λ，以及相應的特徵向量x，那麼x的任何倍數也是相同特徵值的特徵向量。要看到 kx 也是一個特徵向量，請遵循此論點：如果 Ax=λx，那麼 A(kx)=kAx=kλx=λ(kx)。（這裡 k 可以是任何標量。）因此，特徵向量的每個倍數也是一個特徵向量。

注意這裡的非對稱性：特徵值是唯一的，而一個特徵值有多個特徵向量。</gallery> </gallery> </gallery> ~~粗體文字~~Æə=== 查詢特徵值和特徵向量 === 以下是一些使用我們的定義查詢特徵值和特徵向量的示例。

讓

A={\begin{pmatrix}3&0\\-1&2\end{pmatrix}}

首先，我們將 |A-λI|=0 展開以求得特徵值

\left|{\begin{pmatrix}3&0\\-1&2\end{pmatrix}}-{\begin{pmatrix}\lambda &0\\0&\lambda \end{pmatrix}}\right|=0

{\begin{vmatrix}3-\lambda &0\\-1&2-\lambda \end{vmatrix}}=0

(3-\lambda )(2-\lambda )-(0)(-1)=0

(3-\lambda )(2-\lambda )=0

現在，初等代數告訴我們這個方程的根是 3 和 2，因此它們是我們的特徵值。

(練習：證明在 2×2 三角矩陣中，特徵值位於主對角線上。更難的是：推廣這個結果)

現在我們可以找到我們的特徵向量。考慮第一個特徵值 λ=3。為了找到我們的第一個特徵向量

{\mbox{ker}}(A-3I)={\mbox{ker}}{\begin{pmatrix}3-3&0\\-1&2-3\end{pmatrix}}={\mbox{ker}}{\begin{pmatrix}0&0\\-1&-1\end{pmatrix}}

在這一點上我們可以進行行變換和回代，但通常猜測核就足夠了，因為我們的矩陣很小，並且我們有線性相關的列。現在，觀察

{\begin{pmatrix}0&0\\-1&-1\end{pmatrix}}{\begin{pmatrix}a\\-a\end{pmatrix}}=\mathbf {0}

因此，對於任何標量 a，向量

{\begin{pmatrix}a\\-a\end{pmatrix}}

是一個特徵向量。換句話說，矩陣 A 的所有特徵向量的集合包括集合

{\mbox{span}}\{{\begin{pmatrix}1\\-1\end{pmatrix}}\}

。在平面上，這表示一條斜率為 -1，透過原點的直線。

如上所述，矩陣的特徵值是唯一確定的，但對於每個特徵值，都有許多特徵向量。我們通常選擇一個特徵向量，以便“大多數條目為整數”、“第一個條目為 1”或“特徵向量的長度為 1”。大多數計算機代數系統為特徵向量選擇單位向量。

因此，在這裡我們可以取 ${\begin{pmatrix}1\\-1\end{pmatrix}}$ 作為特徵向量，例如。

類似地，對於我們的第二個特徵值 λ=2，為了找到我們的第二個特徵向量

{\mbox{ker}}(A-2I)={\mbox{ker}}{\begin{pmatrix}1&0\\-1&0\end{pmatrix}}={\mbox{span}}\{{\begin{pmatrix}0\\1\end{pmatrix}}\}=\mathbf {0}

因此，我們選擇第二個特徵向量為

{\begin{pmatrix}0\\1\end{pmatrix}}.

我們的特徵值為λ=2,3，特徵向量為 ${\begin{pmatrix}1\\-1\end{pmatrix}},{\begin{pmatrix}0\\1\end{pmatrix}}$ ，可以透過將每個向量與給定矩陣相乘進行驗證。

（我們也可以選擇 ${\begin{pmatrix}1/{\sqrt {(}}2)\\-1/{\sqrt {(}}2)\end{pmatrix}}$ 作為特徵值λ=3的特徵向量。請驗證一下。）

問題集

根據以上內容，求解以下矩陣的特徵值和特徵向量（偶數題答案在後面給出）

${\begin{pmatrix}3&0\\-4&5\end{pmatrix}}$
${\begin{pmatrix}1&1\\3&-1\end{pmatrix}}$
${\begin{pmatrix}-2&0&3\\2&4&0\\1&0&0\end{pmatrix}}$

（較難。提示：一個特徵值為4。）

答案

特徵值：3, 5; 特徵向量： ${\begin{pmatrix}1\\2\end{pmatrix}},{\begin{pmatrix}0\\1\end{pmatrix}}$
特徵值：-2, 2; 特徵向量： ${\begin{pmatrix}-1\\3\end{pmatrix}},{\begin{pmatrix}1\\1\end{pmatrix}}$
特徵值： -3, 1, 4；特徵向量： ${\begin{pmatrix}21\\-6\\-7\end{pmatrix}},{\begin{pmatrix}3\\-2\\3\end{pmatrix}},{\begin{pmatrix}0\\1\\0\end{pmatrix}}$