線性代數入門/特徵值和特徵向量

線性代數入門
特徵值和特徵向量

動機

在討論特徵值、特徵向量和對角化之前，我們先提供一些動機。

示例。 (對角矩陣的冪公式) 令 $D={\begin{pmatrix}3&0\\0&-5\end{pmatrix}}$ . 那麼， $D={\begin{pmatrix}3^{n}&0\\0&(-5)^{n}\end{pmatrix}}$ 對於每個正整數 $n$ ，因為 ${\begin{pmatrix}3&0\\0&-5\end{pmatrix}}{\begin{pmatrix}3^{k}&0\\0&(-5)^{k}\end{pmatrix}}={\begin{pmatrix}3^{k+1}&0\\0&(-5)^{k+1}\end{pmatrix}},$ 我們可以透過歸納法證明對角矩陣的冪公式。

示例. 令 $P={\begin{pmatrix}1&1\\2&3\\\end{pmatrix}}$ 和 $D={\begin{pmatrix}3&0\\0&-5\end{pmatrix}}$ . 那麼，可以計算出 $P^{-1}={\begin{pmatrix}3&-1\\-2&1\\\end{pmatrix}}$ . 令 $A=PDP^{-1}={\begin{pmatrix}19&-8\\48&-21\\\end{pmatrix}}$ . 那麼， ${\begin{aligned}A^{n}&=(PDP^{-1})^{n}=\underbrace {(PD{\color {blue}P^{-1}})({\color {blue}P}DP^{-1})\cdots (PD{\color {brown}P^{-1}})({\color {brown}P}DP^{-1})} _{n\;PDP^{-1}{\text{'s}}}\\&=PD(\underbrace {\color {blue}P^{-1}P} _{\color {blue}I})DP^{-1}\cdots PD(\underbrace {\color {brown}P^{-1}P} _{\color {brown}I})DP^{-1}\\&=PD\underbrace {{\color {blue}I}D\cdots {\color {brown}I}D} _{n-1\;ID{\text{'s}}}P^{-1}\\&=P\underbrace {DD\cdots D} _{n\;D{\text{'s}}}P^{-1}\\&=PD^{n}P^{-1}\\&=P{\begin{pmatrix}3^{n}&0\\0&(-5)^{n}\end{pmatrix}}P^{-1}\qquad {\text{by above example}}\\&={\begin{pmatrix}1&1\\2&3\\\end{pmatrix}}{\begin{pmatrix}3^{n}&0\\0&(-5)^{n}\end{pmatrix}}{\begin{pmatrix}3&-1\\-2&1\\\end{pmatrix}}\\&={\begin{pmatrix}3^{n+1}-2(-5)^{n}&(-5)^{n}-3^{n}\\6(3^{n})-6(-5)^{n}&3(-5)^{n}-2(3^{n})\\\end{pmatrix}}\end{aligned}}$

從這個例子可以看出，對於一些特殊的矩陣，它們的冪可以透過以下形式方便地計算出來： $PDP^{-1}$ ，其中 $P$ 是可逆矩陣， $D$ 是對角矩陣。

當然，給定一個矩陣，我們會想知道它是否可以表示為 $PDP^{-1}$ 的形式，如果可以， $P$ 和 $D$ 是什麼，以便我們可以方便地計算它的冪。這是本章的主要目標。

特徵值，特徵向量和對角化

鑑於動機部分，我們有以下定義。

定義。 (可對角化矩陣) 方陣 $A$ 是 可對角化 的，如果存在一個可逆矩陣 $P$ ，使得 $P^{-1}AP$ 是對角矩陣。

備註。 等價的條件是 $A=PDP^{-1}$ 對於一些對角矩陣 $D$ 和可逆矩陣 $P$ ，這與動機部分的形式相匹配。因此，如果一個矩陣是 可對角化 的，我們可以方便地計算它的冪。

示例。 矩陣 $I_{n}$ 是 可對角化 的，因為存在 $P=I_{n}$ ，使得 $P^{-1}I_{n}P$ 是對角矩陣（即 $I_{n}$ ）。此外，存在 $P=I_{n},D=I_{n}$ ，使得 $I_{n}=PDP^{-1}$ 。

練習。

以下是與對角化在某種程度上相關的重要的通用概念。

定義。（特徵向量和特徵值）設 $A$ 為方陣。如果存在一個標量 $\lambda$ 使得 $A\mathbf {v} =\lambda \mathbf {v}$ ，則一個非零向量 $\mathbf {v}$ 是 $A$ 的一個 特徵向量，則 $\lambda$ 是 $A$ 對應於 特徵向量 $\mathbf {v}$ 的一個 特徵值。

備註。

$A\mathbf {v} =\lambda \mathbf {v}$ 表示將向量 $\mathbf {v}$ 乘以矩陣 $A$ 等價於將其乘以一個標量（向量的縮放）。
字首 eigen- 的意思是“自己的”、“適當的”和“特徵的”。

示例。（單位矩陣的特徵向量）每個向量 $\mathbf {v} \in \mathbb {R} ^{n}$ 是 $I_{n}$ 的一個特徵向量，因為 $I_{n}\mathbf {v} =\mathbf {v} =1\cdot \mathbf {v} ,$ 對於每個向量 $\mathbf {v} \in \mathbb {R} ^{n}$ ，它們的對應特徵值都是 $1$ 。

練習。

	如果 $\mathbf {v}$ 是可逆矩陣 $A$ 的一個特徵向量，那麼它也是 $A^{-1}$ 的一個特徵向量。
	如果 $\lambda$ 是 $A$ 的一個特徵值，那麼 $\lambda ^{n}$ 是 $A^{n}$ 的一個特徵值。
	每個向量 $\mathbf {v} \in \mathbb {R} ^{n}$ 都是零矩陣 $O_{n\times n}$ 的特徵向量。
	零向量是每個方陣的特徵向量。
	如果一個矩陣存在特徵向量，那麼這個矩陣就有無窮多個特徵向量。

以下定理將可對角化矩陣與特徵向量和特徵值聯絡起來。

定理。 (對角化) 設 $A$ 是一個 $n\times n$ 矩陣。那麼， $A$ 是 可對角化 的當且僅當 $A$ 具有 $n$ 個 線性無關特徵向量。如果 $\mathbf {v} _{1},\ldots ,\mathbf {v} _{n}$ 是 $A$ 的 線性無關特徵向量，對應於 特徵值 $\lambda _{1},\ldots ,\lambda _{n}$ （其中一些可能是相同的），我們可以定義一個可逆矩陣 $P$ ，其列為 $\mathbf {v} _{1},\ldots ,\mathbf {v} _{n}$ ，以及一個對角矩陣 $D$ ，其 對角元素 為 $\lambda _{1},\ldots ,\lambda _{n}$ ，使得 $A=PDP^{-1}.$

證明。 以下我們使用 ${\begin{pmatrix}\mathbf {v} _{1}&\cdots &\mathbf {v} _{n}\end{pmatrix}}$ 來表示以 $\mathbf {v} _{1},\ldots ,\mathbf {v} _{n}$ 為列向量，按此順序排列的矩陣。 ${\begin{aligned}&&A&=PDP^{-1}\\&\Leftrightarrow &AP&=PD\underbrace {PP^{-1}} _{I}\\&\Leftrightarrow &A{\begin{pmatrix}\mathbf {v} _{1}&\cdots &\mathbf {v} _{n}\end{pmatrix}}&={\begin{pmatrix}\mathbf {v} _{1}&\cdots &\mathbf {v} _{n}\end{pmatrix}}{\begin{pmatrix}\lambda _{1}&0&\cdots &0\\0&\lambda _{2}&\cdots &0\\\vdots &\vdots &\ddots &\vdots \\0&0&\cdots &\lambda _{n}\end{pmatrix}}\\&\Leftrightarrow &{\begin{pmatrix}A\mathbf {v} _{1}&\cdots &A\mathbf {v} _{n}\end{pmatrix}}&={\begin{pmatrix}\lambda _{1}\mathbf {v} _{1}&\cdots &\lambda _{n}\mathbf {v} _{n}\end{pmatrix}}\\&\Leftrightarrow &A\mathbf {v} _{1}&=\lambda _{1}\mathbf {v} _{1},\ldots ,A\mathbf {v} _{n}=\lambda _{n}\mathbf {v} _{n}.\end{aligned}}$ 我們現在已經證明了 $\mathbf {v} _{1},\ldots ,\mathbf {v} _{n}$ 是 特徵向量。現在剩下要證明的是它們是 線性無關 的，這可以透過以下論據證明：它們是 線性無關 當且僅當 $P$ 可逆，根據可逆性與線性無關的關係命題可知。 $\Box$

備註。

我們可以將特徵向量放入 $P$ 作為列向量，以任意順序，只要我們將特徵值放入 $D$ 的對應列中，例如，我們可以將 $\mathbf {v} _{1}$ 放入 $P$ 的第 3 列，但我們需要將 $\lambda _{1}$ 放入 $D$ 的第 3 列。

由此可知，對角化的表示式 並不唯一，實際上有無限多個表示式。

根據矩陣乘法的定義，我們有 $A{\begin{pmatrix}\mathbf {v} _{1}&\cdots &\mathbf {v} _{n}\end{pmatrix}}={\begin{pmatrix}A\mathbf {v} _{1}&\cdots &A\mathbf {v} _{n}\end{pmatrix}},$ 例如， $A{\begin{pmatrix}\mathbf {u} &\mathbf {w} \end{pmatrix}}:={\begin{pmatrix}1&2\\3&4\\\end{pmatrix}}{\begin{pmatrix}u_{1}&w_{1}\\u_{2}&w_{2}\end{pmatrix}}={\begin{pmatrix}u_{1}+2u_{2}&w_{1}+2w_{2}\\3u_{1}+4u_{2}&3w_{1}+4w_{2}\\\end{pmatrix}},A\mathbf {u} ={\begin{pmatrix}u_{1}+2u_{2}\\3u_{1}+4u_{2}\\\end{pmatrix}},A\mathbf {w} ={\begin{pmatrix}w_{1}+2w_{2}\\3w_{1}+4w_{2}\\\end{pmatrix}}$

接下來，我們將介紹一種方便的方法來找到 特徵值。在此之前，我們先介紹一個與這種尋找特徵值的方法相關的術語。

定義. （特徵多項式）設 $A$ 為 $n\times n$ 矩陣。 $A$ 關於變數 $t$ 的 特徵多項式 是多項式 $\det(A-tI_{n})$ 。

備註。

我們可以使用任意字母來表示變數。
等價地，特徵多項式 of $A$ 是 $A$ 的行列式，其對角線元素減去 $t$ .

示例. ${\begin{pmatrix}1&2&4\\4&5&2\\0&0&9\\\end{pmatrix}}$ 的特徵多項式是 ${\begin{vmatrix}1-t&2&4\\4&5-t&2\\0&0&9-t\\\end{vmatrix}}=(9-t){\begin{vmatrix}1-t&2\\4&5-t\\\end{vmatrix}}=(9-t)[(1-t)(5-t)-2(4)]=-x^{3}+15x^{2}-51x-27.$ .

命題. (特徵值等價條件) 設 $A$ 是一個 $n\times n$ 矩陣。則， $\lambda$ 是 $A$ 的特徵值 當且僅當 $\det(A-\lambda I_{n})=0$ ，即它是 $A$ 的特徵多項式 的根。

證明. ${\begin{aligned}&&\lambda {\text{ is an }}&{\text{eigenvalue of }}A\\&\Leftrightarrow &A\mathbf {v} &=\lambda \mathbf {v} \qquad {\text{for some }}\mathbf {v} \neq \mathbf {0} \\&\Leftrightarrow &(A-\lambda I_{n})\mathbf {v} &=\mathbf {0} \qquad {\text{for some }}\mathbf {v} \neq \mathbf {0} \\&\Leftrightarrow &A-\lambda I_{n}&{\text{ is non-invertible}}\qquad {\text{by simplified invertible matrix theorem}}\\&\Leftrightarrow &\det(A-\lambda I_{n})&=0\end{aligned}}$ .

$\Box$

接下來，我們將介紹一個與特徵向量相關的概念。

練習。

	一個方陣有 $n$ 個不同的特徵值，如果其特徵多項式有 $n$ 個根。
	如果大小為 $2\times 2$ 的矩陣 $A$ 有兩個線性無關的特徵向量 $(3,1)^{T},(0,2)^{T}$ ，分別對應特徵值 $4,5$ ，那麼我們可以定義一個可逆矩陣 $P={\begin{pmatrix}3&1\\0&2\\\end{pmatrix}}$ 和一個對角矩陣 $D={\begin{pmatrix}4&0\\0&5\end{pmatrix}}$ ，使得 $A=P^{-1}DP$ 。
	如果大小為 $2\times 2$ 的矩陣 $A$ 有兩個線性無關的特徵向量，那麼我們可以定義一個可逆矩陣 $P$ 和一個對角矩陣 $D$ ，使得 $A=P^{-1}DP$ 。

定義。 （特徵空間）令 $A$ 為一個 $n\times n$ 矩陣。假設 $\lambda$ 是 $A$ 的一個 特徵值。那麼， $\operatorname {Null} (A-\lambda I_{n})$ ，記作 $E_{\lambda }$ ，是 $A$ 對應於 $\lambda$ 的 特徵空間。

備註。

由於零空間是 $\mathbb {R} ^{n}$ 的子空間，因此 特徵空間 也是 $\mathbb {R} ^{n}$ 的子空間。
$E_{\lambda }$ 由零向量（因為它是一個子空間）和所有對應於 $\lambda$ 的 特徵向量 組成，因為

$A\mathbf {v} =\lambda \mathbf {v} \iff (A-\lambda I_{n})\mathbf {v} =\mathbf {0} \iff \mathbf {v} \in \operatorname {Null} (A-\lambda I_{n})=E_{\lambda }\quad (\mathbf {v} \neq \mathbf {0} {\text{ by definition}})$

在介紹了這些術語和概念之後，我們有以下用於對 $n\times n$ 矩陣進行對角化的演算法步驟

透過求解 $\det(A-\lambda I)=0$ 計算 $A$ 的所有 特徵值
對於矩陣 $A$ 的每個特徵值 $\lambda _{1},\ldots ,\lambda _{k}$ ，找到對應 特徵空間 $E_{\lambda _{1}},\ldots ,E_{\lambda _{k}}$ 的基 $\beta _{1},\ldots ,\beta _{k}$ 。
如果 $\beta _{1},\ldots ,\beta _{k}$ 包含 $n$ 個向量 $\mathbf {v} _{1},\ldots ,\mathbf {v} _{n}$ （如果沒有，則 $A$ 不可對角化），定義 $P={\begin{pmatrix}\mathbf {v} _{1}&\cdots &\mathbf {v} _{n}\end{pmatrix}}$
我們有 $A=PDP^{-1}$ ，其中 $D$ 是一個對角矩陣，其對角元素是對應於 $\mathbf {v} _{1},\ldots ,\mathbf {v} _{n}$ 的 特徵值。

備註。

可以證明，對應於 不同特徵值 的 $A$ 的 特徵向量 是 線性無關 的（證明過程在此省略）。

因此， $P$ 的列向量線性無關，所以 $P$ 是可逆的。

如果 $A$ 有 $n$ 個 不同的特徵值，那麼 $A$ 是可對角化的^[1]，因為有 $n$ 個基對應於 $n$ 個 特徵值，它們共同包含 $n$ 個向量 $\mathbf {v} _{1},\ldots ,\mathbf {v} _{n}$ .
每個特徵值有無限多個可能的基，但我們只需要其中一個。

例子。 （ $2\times 2$ 矩陣的對角化）回憶一下動機部分的例子，給定矩陣 $A={\begin{pmatrix}19&-8\\48&-21\\\end{pmatrix}}$ 是可對角化的，並且它的 $PDP^{-1}$ 形式的表示式也被給出。我們將使用上述過程來推匯出給定的表示式。

首先， ${\begin{vmatrix}19-\lambda &-8\\48&-21-\lambda \end{vmatrix}}=0\iff (19-\lambda )(-21-\lambda )+8(48)=0\implies \lambda ^{2}+2\lambda -15=0\iff \lambda =3{\text{ or }}\lambda =-5.$ 所以，矩陣的特徵值為 $\lambda =3$ 和 $\lambda =-5$ .

對於特徵值 $\lambda ={\color {green}3}$ ，因為 $(A-3I)\mathbf {x} =\mathbf {0} \implies {\begin{pmatrix}16&-8\\48&-24\\\end{pmatrix}}\mathbf {x} =\mathbf {0}$ ，並且可以證明其通解為 $\mathbf {x} =(a,2a)^{T}$ ，因此 $E_{3}$ 的基為 $\{{\color {green}(1,2)^{T}}\}$

對於特徵值 $\lambda ={\color {blue}-5}$ ，因為 $(A+5I)\mathbf {x} =\mathbf {0} \implies {\begin{pmatrix}24&-8\\48&-16\\\end{pmatrix}}\mathbf {x} =\mathbf {0}$ ，並且可以證明其通解為 $\mathbf {x} =(b,3b)^{T}$ ，因此 $E_{-5}$ 的基為 $\{{\color {blue}(1,3)^{T}}\}$

然後，我們令 $P={\begin{pmatrix}{\color {green}1}&{\color {blue}1}\\{\color {green}2}&{\color {blue}3}\\\end{pmatrix}}$ （因為兩個基底加起來包含兩個向量），並且 $D={\begin{pmatrix}{\color {green}3}&0\\0&{\color {blue}-5}\end{pmatrix}}.$ 然後，我們可以計算得到 $P^{-1}={\begin{pmatrix}3&-1\\-2&1\\\end{pmatrix}}.$ 因此，我們有 $A=PDP^{-1}={\begin{pmatrix}{\color {green}1}&{\color {blue}1}\\{\color {green}2}&{\color {blue}3}\\\end{pmatrix}}{\begin{pmatrix}{\color {green}3}&0\\0&{\color {blue}-5}\end{pmatrix}}{\begin{pmatrix}3&-1\\-2&1\\\end{pmatrix}},$ 這與動機部分示例中給出的形式相同。一般來說，如果我們有 $A=PDP^{-1}$ ， $A^{n}=PD^{n}P^{-1},$ 這在動機部分的示例中有所說明。從動機部分的示例來看， $A^{n}={\begin{pmatrix}3^{n+1}-2(-5)^{n}&(-5)^{n}-3^{n}\\6(3^{n})-6(-5)^{n}&3(-5)^{n}-2(3^{n})\\\end{pmatrix}}.$

示例：（ $3\times 3$ 矩陣的對角化）考慮矩陣 $A={\begin{pmatrix}0&0&1\\0&1&0\\1&0&0\\\end{pmatrix}}$ （它不是 $I_{3}$ ）。我們希望找到一個關於 $A^{n}$ 的公式。首先， ${\begin{vmatrix}-\lambda &0&1\\0&1-\lambda &0\\1&0&-\lambda \end{vmatrix}}=0\implies \lambda ^{2}(1-\lambda )-(1-\lambda )=0\implies (1-\lambda )(\lambda ^{2}-1)=0\implies \lambda =1{\text{(repeated) or }}\lambda =-1.$ 因此，矩陣的特徵值為 $\lambda =1$ 和 $\lambda =-1$ 。

對於特徵值 $\lambda ={\color {green}1}$ ，由於 $(A-I)\mathbf {x} =\mathbf {0} \implies {\begin{pmatrix}-1&0&1\\0&0&0\\1&0&-1\end{pmatrix}}\mathbf {x} =\mathbf {0} \implies \mathbf {x} =(b,a,b)^{T}=b(1,0,1)^{T}+a(0,1,0)^{T},$ （有兩個獨立的未知數，所以每個特徵空間的基的維數是 $2$ ，即每個基應該有兩個向量）， $E_{1}$ 的一個基是 $\{{\color {green}(1,0,1)^{T}},{\color {green}(0,1,0)^{T}}\}$ 。

對於特徵值 $\lambda ={\color {blue}-1}$ ，由於 $(A+I)\mathbf {x} =\mathbf {0} \implies {\begin{pmatrix}1&0&1\\0&2&0\\1&0&1\end{pmatrix}}\mathbf {x} =\mathbf {0} \implies \mathbf {x} =(c,0,-c)^{T},$ ， $E_{-1}$ 的一個基為 $\{{\color {blue}(1,0,-1)^{T}}\}$ .

Then, we let $P={\begin{pmatrix}{\color {green}1}&{\color {green}0}&{\color {blue}1}\\{\color {green}0}&{\color {green}1}&{\color {blue}0}\\{\color {green}1}&{\color {green}0}&{\color {blue}-1}\end{pmatrix}}$ , (since the two bases together contain three vectors) $D={\begin{pmatrix}{\color {green}1}&0&0\\0&{\color {green}1}&0\\0&0&{\color {blue}-1}\end{pmatrix}}$ (we have two eigenvectors corresponding to the eigenvalue $\lambda =1$ , so this eigenvalue is repeated two times). Then, we can compute that $P^{-1}={\begin{pmatrix}{\frac {1}{2}}&0&{\frac {1}{2}}\\0&1&0\\{\frac {1}{2}}&0&-{\frac {1}{2}}\end{pmatrix}}$ . It follows that $A=PDP^{-1}={\begin{pmatrix}{\color {green}1}&{\color {green}0}&{\color {blue}1}\\{\color {green}0}&{\color {green}1}&{\color {blue}0}\\{\color {green}1}&{\color {green}0}&{\color {blue}-1}\end{pmatrix}}{\begin{pmatrix}{\color {green}1}&0&0\\0&{\color {green}1}&0\\0&0&{\color {blue}-1}\end{pmatrix}}{\begin{pmatrix}{\frac {1}{2}}&0&{\frac {1}{2}}\\0&1&0\\{\frac {1}{2}}&0&-{\frac {1}{2}}\end{pmatrix}},$ and $A^{n}=PD^{n}P^{-1}={\begin{pmatrix}{\color {green}1}&{\color {green}0}&{\color {blue}1}\\{\color {green}0}&{\color {green}1}&{\color {blue}0}\\{\color {green}1}&{\color {green}0}&{\color {blue}-1}\end{pmatrix}}{\begin{pmatrix}{\color {green}1}^{n}&0&0\\0&{\color {green}1}^{n}&0\\0&0&({\color {blue}-1})^{n}\end{pmatrix}}{\begin{pmatrix}{\frac {1}{2}}&0&{\frac {1}{2}}\\0&1&0\\{\frac {1}{2}}&0&-{\frac {1}{2}}\end{pmatrix}}={\begin{pmatrix}{\frac {1+(-1)^{n}}{2}}&0&{\frac {1-(-1)^{n}}{2}}\\0&1&0\\{\frac {1-(-1)^{n}}{2}}&0&{\frac {1+(-1)^{n}}{2}}\\\end{pmatrix}}={\begin{cases}I_{3}&{\text{if }}n{\text{ is even}}\\A&{\text{if }}n{\text{ is odd}}\end{cases}}.$ This is an interesting result.

例：（復特徵值）令 $A={\begin{pmatrix}1&2\\-2&1\\\end{pmatrix}}.$ ^[2] ${\begin{vmatrix}1-\lambda &2\\-2&1-\lambda \end{vmatrix}}=0\implies (1-\lambda )^{2}+4=0\implies (1-\lambda )^{2}=-4\implies 1-\lambda =\pm 2i\implies \lambda =1\mp 2i.$ 由於特徵值都是複數（因此不存在相應的實特徵向量）， $A$ 是不可對角化的 在實矩陣上。另一方面， $A$ 是在復矩陣上可以對角化的，但我們在本書中不關注復矩陣上的對角化，並且我們沒有定義復矩陣的運算。因此， $A$ 用 $PDP^{-1}$ 的形式表示如下，僅供參考： $A={\begin{pmatrix}i&-i\\1&1\\\end{pmatrix}}{\begin{pmatrix}1-2i&0\\0&1+2i\end{pmatrix}}{\begin{pmatrix}i&-i\\1&1\end{pmatrix}}^{-1}.$

例。（不可對角化矩陣）考慮矩陣 $N={\begin{pmatrix}0&1\\0&0\\\end{pmatrix}}$ （它是一個 冪零矩陣，滿足 $N^{2}=O$ ）。

首先，由於 ${\begin{vmatrix}-\lambda &1\\0&-\lambda \end{vmatrix}}=0\implies \lambda ^{2}=0\implies \lambda =0,$ 唯一的特徵值為 $\lambda =0$ .

對於特徵值 $\lambda =0$ ，由於 $(N+0I)\mathbf {x} =\mathbf {0} \implies N\mathbf {x} =\mathbf {0} \implies {\begin{pmatrix}0&1\\0&0\\\end{pmatrix}}\mathbf {x} =\mathbf {0} \implies \mathbf {x} =(a,0)^{T}$ 所以， $E_{0}$ 的一個基是 $\{(1,0)^{T}\}$ 。由於它只包含一個向量，而矩陣的大小為 $2\times 2$ ， $N$ 是 不可對角化的。

練習。

	${\begin{pmatrix}1024&0\\0&59049\\\end{pmatrix}}$ .
	${\begin{pmatrix}7776&0\\0&7776\end{pmatrix}}$ .
	${\begin{pmatrix}7777&0\\0&7777\end{pmatrix}}$ .
	${\begin{pmatrix}59049&0\\0&1024\\\end{pmatrix}}$ .

	在實矩陣上，特徵空間可以是零空間，即僅包含零向量。
	特徵空間必須包含無限多個特徵向量。
	特徵空間的每個基都包含線性無關的向量。
	假設透過對角化，矩陣 $A$ 可以表示為 $A=PDP^{-1}$ ，其中 $P$ 是一個可逆矩陣，而 $D$ 是一個對角矩陣，那麼，對於每個正整數 $n$ ， $P^{-1}A^{n}P$ 是一個對角矩陣。

在接下來的內容中，我們將討論對角化的一些數學應用，包括推匯出序列公式以及求解 常微分方程 (ODE) 系統。

示例. (斐波那契數列) 考慮 斐波那契數列 $F_{0},F_{1},\ldots$ ，其中 $F_{0}=0$ ， $F_{1}=1$ 以及對於每個非負整數 $n$ 有 $F_{n+2}=F_{n+1}+F_{n}$ 。對於每個非負整數 $n$ ，這個遞推關係可以描述為 ${\begin{pmatrix}F_{n+2}\\F_{n+1}\end{pmatrix}}={\begin{pmatrix}1&1\\1&0\\\end{pmatrix}}{\begin{pmatrix}F_{n+1}\\F_{n}\end{pmatrix}}={\begin{pmatrix}F_{n+1}+F_{n}\\F_{n}\end{pmatrix}}.$

令 $A={\begin{pmatrix}1&1\\1&0\\\end{pmatrix}}$ 。那麼， ${\begin{pmatrix}F_{n+1}\\F_{n}\end{pmatrix}}=A{\begin{pmatrix}F_{n}\\F_{n-1}\end{pmatrix}}=A^{2}{\begin{pmatrix}F_{n-1}\\F_{n-2}\\\end{pmatrix}}=\cdots =A^{n}{\begin{pmatrix}F_{1}\\F_{0}\end{pmatrix}}=A^{n}{\begin{pmatrix}1\\0\\\end{pmatrix}}.$

為了得到 $F_{n}$ 的表示式，只需要找到 $A^{n}$ 的公式，我們可以透過對角化來找到它。

由於 ${\begin{vmatrix}1-\lambda &1\\1&-\lambda \end{vmatrix}}=0\implies (1-\lambda )(-\lambda )-1=0\implies \lambda ^{2}-\lambda -1=0\implies \lambda ={\frac {1+{\sqrt {5}}}{2}}{\text{ or }}{\frac {1-{\sqrt {5}}}{2}}.$ 令 $\varphi ={\frac {1+{\sqrt {5}}}{2}}$ 為 黃金分割， $\psi ={\frac {1-{\sqrt {5}}}{2}}$ 為 黃金分割 的共軛。

對於特徵值 $\lambda ={\color {green}\varphi }$ ，因為對於 ${\begin{pmatrix}1-\varphi &1\\1&-\varphi \end{pmatrix}}\mathbf {x} =\mathbf {0} ,$ ，我們可以將表示此線性方程組的增廣矩陣轉換為行最簡形式如下： ${\begin{pmatrix}1-\varphi &1&0\\1&-\varphi &0\\\end{pmatrix}}{\overset {\mathbf {r} _{1}\leftrightarrow \mathbf {r} _{2}}{\to }}{\begin{pmatrix}1&-\varphi &0\\1-\varphi &1&0\\\end{pmatrix}}{\overset {-(1-\varphi )\mathbf {r} _{1}+\mathbf {r} _{2}\to \mathbf {r} _{2}}{\to }}{\begin{pmatrix}1&-\varphi &0\\0&1+\varphi -\varphi ^{2}&0\\\end{pmatrix}}={\begin{pmatrix}1&-\varphi &0\\0&0&0\\\end{pmatrix}}.$ ^[3] 因此，通解是 $\mathbf {x} =(a\varphi ,a)^{T}$ ，因此 $E_{\varphi }$ 的一個基是 $\{{\color {green}(\varphi ,1)^{T}}\}$ 。

對於特徵值 $\lambda ={\color {blue}\psi }$ ，因為 ${\begin{pmatrix}1-\psi &1\\1&-\psi \end{pmatrix}}\mathbf {x} =\mathbf {0} ,$ ，表示此線性方程組的增廣矩陣的行最簡形式是 ${\begin{pmatrix}1&-\psi &0\\0&0&0\\\end{pmatrix}}$ ，這是由於對稱性^[4]。因此，通解是 $\mathbf {x} =(b\psi ,b)^{T}$ ，因此 $E_{\psi }$ 的一個基是 $\{{\color {blue}(\psi ,1)^{T}}\}$ 。

Then, we let $P={\begin{pmatrix}{\color {green}\varphi }&{\color {blue}\psi }\\{\color {green}1}&{\color {blue}1}\end{pmatrix}}$ , $D={\begin{pmatrix}{\color {green}\varphi }&0\\0&{\color {blue}\psi }\end{pmatrix}}$ . We can compute that $P^{-1}={\frac {1}{\varphi -\psi }}{\begin{pmatrix}1&-\psi \\-1&\varphi \end{pmatrix}}$ Then, $A=PDP^{-1}$ , and thus $A^{n}=PD^{n}P^{-1}={\frac {1}{\varphi -\psi }}{\begin{pmatrix}{\color {green}\varphi }&{\color {blue}\psi }\\{\color {green}1}&{\color {blue}1}\end{pmatrix}}{\begin{pmatrix}{\color {green}\varphi }^{n}&0\\0&{\color {blue}\psi }^{n}\end{pmatrix}}{\begin{pmatrix}1&-\psi \\-1&\varphi \end{pmatrix}}={\frac {1}{\varphi -\psi }}{\begin{pmatrix}\varphi ^{n+1}&\psi ^{n+1}\\\varphi ^{n}&\psi ^{n}\end{pmatrix}}{\begin{pmatrix}1&-\psi \\-1&\varphi \end{pmatrix}}={\frac {1}{\varphi -\psi }}{\begin{pmatrix}\varphi ^{n+1}-\psi ^{n+1}&-\psi \varphi ^{n+1}+\varphi \psi ^{n+1}\\\varphi ^{n}-\psi ^{n}&-\psi \varphi ^{n}+\varphi \psi ^{n}\end{pmatrix}}$ Finally, we have ${\begin{pmatrix}F_{n+1}\\F_{n}\end{pmatrix}}={\frac {1}{\varphi -\psi }}{\begin{pmatrix}\varphi ^{n+1}-\psi ^{n+1}&-\psi \varphi ^{n+1}+\varphi \psi ^{n+1}\\\varphi ^{n}-\psi ^{n}&-\psi \varphi ^{n}+\varphi \psi ^{n}\end{pmatrix}}{\begin{pmatrix}1\\0\\\end{pmatrix}}={\frac {1}{\varphi -\psi }}{\begin{pmatrix}\varphi ^{n+1}-\psi ^{n+1}\\\varphi ^{n}-\psi ^{n}\end{pmatrix}}.$ Thus, $F_{n}={\frac {\varphi ^{n}-\psi ^{n}}{\varphi -\psi }}$ in which $\varphi ={\frac {1+{\sqrt {5}}}{2}}$ and $\psi ={\frac {1-{\sqrt {5}}}{2}}$ .

練習。 定義一個數列 $a_{0},a_{1},\ldots$ ，其中 $a_{0}=1$ 且對於每個非負整數 $n$ ， $a_{n+1}=2a_{n}$ 成立。

	$a_{n}=2^{n-1}$ .
	$a_{n}=8a_{n-2}$ .
	$a_{n}=32a_{n-5}$ .
	$a_{n}=128a_{n-6}$ .

	$b_{n}=2^{n}+1$ .
	$b_{n}=3-2^{n}$ .
	$b_{n}=2^{n}$ .
	$b_{n}=2b_{n-1}$ .
	$b_{n}=b_{n-1}+2$ .

示例. (常微分方程組) 考慮常微分方程組 ${\begin{cases}{\frac {dx}{dt}}&=2x-3y\\{\frac {dy}{dt}}&=4x-5y\\\end{cases}}$ ，初始條件為 $(x,y)=(1,2)$ ，當 $t=0$ 。

Using the dot notation for differentiation, the system can be rewritten as ${\begin{pmatrix}{\dot {x}}\\{\dot {y}}\end{pmatrix}}=A{\begin{pmatrix}x\\y\end{pmatrix}}$ in which $A={\begin{pmatrix}2&-3\\4&-5\\\end{pmatrix}}$ . Suppose we can write $A=PDP^{-1}\iff D=P^{-1}AP$ in which $P$ is an invertible matrix and $D$ is a diagonal matrix. Let $P^{-1}={\begin{pmatrix}a&b\\c&d\\\end{pmatrix}}$ in which $a,b,c,d$ are some real numbers. Also, let ${\begin{pmatrix}u\\v\\\end{pmatrix}}=P^{-1}{\begin{pmatrix}x\\y\\\end{pmatrix}}={\begin{pmatrix}a&b\\c&d\\\end{pmatrix}}={\begin{pmatrix}ax+by\\cx+dy\\\end{pmatrix}}$ , which implies $u=ax+by$ and $v=cx+dy$ , and ${\begin{pmatrix}x\\y\\\end{pmatrix}}=P{\begin{pmatrix}u\\v\end{pmatrix}}$ . It follows that ${\dot {u}}=a{\dot {x}}+b{\dot {y}}$ and ${\dot {v}}=c{\dot {x}}+d{\dot {y}}$ . Thus, ${\begin{pmatrix}{\dot {u}}\\{\dot {v}}\end{pmatrix}}={\begin{pmatrix}a&b\\c&d\\\end{pmatrix}}{\begin{pmatrix}{\dot {x}}\\{\dot {y}}\end{pmatrix}}=P^{-1}{\begin{pmatrix}{\dot {x}}\\{\dot {y}}\end{pmatrix}}=P^{-1}A{\begin{pmatrix}x\\y\\\end{pmatrix}}=P^{-1}AP{\begin{pmatrix}u\\v\\\end{pmatrix}}=D{\begin{pmatrix}u\\v\end{pmatrix}}.$ Let $D={\begin{pmatrix}d_{1}&0\\0&d_{2}\end{pmatrix}}$ , then the system can be simplified to ${\begin{cases}{\frac {du}{dt}}&=d_{1}u\\{\frac {dv}{dt}}&=d_{2}v\end{cases}}\implies {\begin{cases}{\frac {1}{u}}\,du&=d_{1}\,dt\\{\frac {1}{v}}\,dv&=d_{2}\,dt\end{cases}}\implies {\begin{cases}\int {\frac {1}{u}}\,du&=\int d_{1}\,dt\\\int {\frac {1}{v}}\,dv&=\int d_{2}\,dt\end{cases}}\implies {\begin{cases}\ln |u|&=d_{1}t+C_{1}\\\ln |v|&=d_{2}t+C_{2}\end{cases}}\implies {\begin{cases}u&=\pm e^{d_{1}t+C_{1}}\\v&=\pm e^{d_{2}t+C_{2}}\end{cases}}\implies {\begin{cases}u&=C_{3}e^{d_{1}t}\\v&=C_{4}e^{d_{2}t}\end{cases}}$ in which $C_{1},C_{2}$ are arbitrary constants, and $C_{3}=\pm e^{C_{1}},C_{4}=\pm e^{C_{2}}$ .

然後，我們透過對角化 $A$ 來求解 $D$ ： ${\begin{vmatrix}2-\lambda &-3\\4&-5-\lambda \end{vmatrix}}=0\implies (2-\lambda )(-5-\lambda )+12=0\implies \lambda ^{2}+3\lambda +2=0\implies \lambda =-1{\text{ or }}\lambda =-2.$ 對於特徵值 $\lambda =-1$ ， ${\begin{pmatrix}3&-3\\4&-4\end{pmatrix}}\mathbf {x} =\mathbf {0} ,$ ，其通解為 $\mathbf {x} =(s,s)^{T}$ ，因此 $E_{-1}=\{(1,1)^{T}\}$ 的一個基。

對於特徵值 $\lambda =-2$ ， ${\begin{pmatrix}4&-3\\4&-3\end{pmatrix}}\mathbf {x} =\mathbf {0} ,$ ，其通解為 $\mathbf {x} =(t,4t/3)^{T}$ ，因此 $E_{-2}=\{(1,4/3)^{T}\}$ 的基底為。

然後，令 $P={\begin{pmatrix}1&1\\1&{\frac {4}{3}}\end{pmatrix}}$ 以及 $D={\begin{pmatrix}-1&0\\0&-2\end{pmatrix}}$ 。由此可知， $P^{-1}={\begin{pmatrix}4&-3\\-3&3\end{pmatrix}}$ 。然後， $A=PDP^{-1}$ 。

因此， $d_{1}=-1$ 和 $d_{2}=-2$ ，所以 $u=C_{3}e^{-t}$ 和 $v=C_{4}e^{-2t}$ 。應用初始條件 $(x,y)=(1,2)$ 當 $t=0$ 時， ${\begin{pmatrix}u\\v\\\end{pmatrix}}=P^{-1}{\begin{pmatrix}1\\2\\\end{pmatrix}}={\begin{pmatrix}4&-3\\-3&3\end{pmatrix}}{\begin{pmatrix}1\\3\\\end{pmatrix}}={\begin{pmatrix}-2\\3\end{pmatrix}}$ 當 $t=0$ 時，這意味著 $u=-2e^{-t}$ 和 $v=3e^{-2t}$ 。因此， ${\begin{pmatrix}x\\y\end{pmatrix}}=P{\begin{pmatrix}u\\v\end{pmatrix}}={\begin{pmatrix}1&1\\1&{\frac {4}{3}}\end{pmatrix}}{\begin{pmatrix}-2e^{-t}\\3e^{-2t}\end{pmatrix}}={\begin{pmatrix}3e^{-2t}-2e^{-t}\\4e^{-2t}-2e^{-t}\end{pmatrix}}.$ 因此，此微分方程組的解為 $(x,y)=(3e^{-2t}-2e^{-t},4e^{-2t}-2e^{-t}).$

練習。

向量和子空間

線性代數入門
特徵值和特徵向量

↑ 但即使 $A$ 具有嚴格少於 $n$ 個特徵值， $A$ 仍然可以是對角化的。實際上， $A$ 最多有 $n$ 個不同的特徵值，因為 $\lambda$ 的特徵多項式是 $\lambda$ 的 $n$ 次多項式，根據代數基本定理，它有 $n$ 個根（其中一些可能重複）。
↑ 它是複數 $1+2i$ 的矩陣表示形式。
↑ $1+\varphi -\varphi ^{2}=0$ 因為 $1+\varphi -\varphi =-(\underbrace {\varphi ^{2}-\varphi -1} _{0})=0$
↑ 特別地， $1+\varphi -\varphi ^{2}=1+\psi -\psi ^{2}=0.$ ，因為 $\varphi ,\psi$ 都滿足方程 $\lambda ^{2}-\lambda -1=0$ .

[1] 但即使 $A$ 具有嚴格少於 $n$ 個特徵值， $A$ 仍然可以是對角化的。實際上， $A$ 最多有 $n$ 個不同的特徵值，因為 $\lambda$ 的特徵多項式是 $\lambda$ 的 $n$ 次多項式，根據代數基本定理，它有 $n$ 個根（其中一些可能重複）。

[2] 它是複數 $1+2i$ 的矩陣表示形式。

[3] $1+\varphi -\varphi ^{2}=0$ 因為 $1+\varphi -\varphi =-(\underbrace {\varphi ^{2}-\varphi -1} _{0})=0$

[4] 特別地， $1+\varphi -\varphi ^{2}=1+\psi -\psi ^{2}=0.$ ，因為 $\varphi ,\psi$ 都滿足方程 $\lambda ^{2}-\lambda -1=0$ .

[1]

[2]

[3]

[4]

	$(x,y)=(2e^{2t},3e^{6t})$ .
	$(x,y)=(2e^{2t}+3e^{6t},3e^{2t}+2e^{6t})$ .
	$(x,y)=(2e^{6t}+3e^{2t},3e^{6t}+2e^{2t})$ .
	$(x,y)=(3e^{2t},2e^{6t})$ .
	$(x,y)=(3e^{6t},2e^{2t})$ .

	不存在這樣的 $k$ 。
	$k=0$
	$k=1$
	$k$ 可以是任意實數。

	該系統不一致。
	$(x,y,z)=(2,3,8)$
	$(x,y,z)=(-6,1,2)$
	$(x,y,z)=(-6t,t,2t)$
	$(x,y,z)=(2t+2,3t+3,8t+8)$
	$(x,y,z)=(-6t+2,t+3,2t+8)$
	$(x,y,z)=(2t-6,3t+1,8t+2)$

	零矩陣。
	$2I.$
	對角矩陣。