在討論特徵值、特徵向量 和對角化 之前,我們先提供一些動機。
從這個例子可以看出,對於一些特殊的矩陣,它們的冪可以透過以下形式方便地計算出來: P D P − 1 {\displaystyle PDP^{-1}} ,其中 P {\displaystyle P} 是可逆矩陣, D {\displaystyle D} 是對角矩陣。
當然,給定一個矩陣,我們會想知道它是否可以表示為 P D P − 1 {\displaystyle PDP^{-1}} 的形式,如果可以, P {\displaystyle P} 和 D {\displaystyle D} 是什麼,以便我們可以方便地計算它的冪。 這是本章的主要目標。
鑑於動機部分,我們有以下定義。
練習。
以下是與對角化在某種程度上相關的重要的通用概念。
練習。
以下定理將可對角化矩陣與特徵向量和特徵值聯絡起來。
定理。 (對角化) 設 A {\displaystyle A} 是一個 n × n {\displaystyle n\times n} 矩陣。那麼, A {\displaystyle A} 是 可對角化 的當且僅當 A {\displaystyle A} 具有 n {\displaystyle n} 個 線性無關特徵向量 。如果 v 1 , … , v n {\displaystyle \mathbf {v} _{1},\ldots ,\mathbf {v} _{n}} 是 A {\displaystyle A} 的 線性無關特徵向量 ,對應於 特徵值 λ 1 , … , λ n {\displaystyle \lambda _{1},\ldots ,\lambda _{n}} (其中一些可能是相同的),我們可以 定義 一個 可逆 矩陣 P {\displaystyle P} ,其 列 為 v 1 , … , v n {\displaystyle \mathbf {v} _{1},\ldots ,\mathbf {v} _{n}} ,以及一個 對角 矩陣 D {\displaystyle D} ,其 對角元素 為 λ 1 , … , λ n {\displaystyle \lambda _{1},\ldots ,\lambda _{n}} ,使得 A = P D P − 1 . {\displaystyle A=PDP^{-1}.}
證明。 以下我們使用 ( v 1 ⋯ v n ) {\displaystyle {\begin{pmatrix}\mathbf {v} _{1}&\cdots &\mathbf {v} _{n}\end{pmatrix}}} 來表示以 v 1 , … , v n {\displaystyle \mathbf {v} _{1},\ldots ,\mathbf {v} _{n}} 為列向量,按此順序排列的矩陣。 A = P D P − 1 ⇔ A P = P D P P − 1 ⏟ I ⇔ A ( v 1 ⋯ v n ) = ( v 1 ⋯ v n ) ( λ 1 0 ⋯ 0 0 λ 2 ⋯ 0 ⋮ ⋮ ⋱ ⋮ 0 0 ⋯ λ n ) ⇔ ( A v 1 ⋯ A v n ) = ( λ 1 v 1 ⋯ λ n v n ) ⇔ A v 1 = λ 1 v 1 , … , A v n = λ n v n . {\displaystyle {\begin{aligned}&&A&=PDP^{-1}\\&\Leftrightarrow &AP&=PD\underbrace {PP^{-1}} _{I}\\&\Leftrightarrow &A{\begin{pmatrix}\mathbf {v} _{1}&\cdots &\mathbf {v} _{n}\end{pmatrix}}&={\begin{pmatrix}\mathbf {v} _{1}&\cdots &\mathbf {v} _{n}\end{pmatrix}}{\begin{pmatrix}\lambda _{1}&0&\cdots &0\\0&\lambda _{2}&\cdots &0\\\vdots &\vdots &\ddots &\vdots \\0&0&\cdots &\lambda _{n}\end{pmatrix}}\\&\Leftrightarrow &{\begin{pmatrix}A\mathbf {v} _{1}&\cdots &A\mathbf {v} _{n}\end{pmatrix}}&={\begin{pmatrix}\lambda _{1}\mathbf {v} _{1}&\cdots &\lambda _{n}\mathbf {v} _{n}\end{pmatrix}}\\&\Leftrightarrow &A\mathbf {v} _{1}&=\lambda _{1}\mathbf {v} _{1},\ldots ,A\mathbf {v} _{n}=\lambda _{n}\mathbf {v} _{n}.\end{aligned}}} 我們現在已經證明了 v 1 , … , v n {\displaystyle \mathbf {v} _{1},\ldots ,\mathbf {v} _{n}} 是 特徵向量 。 現在剩下要證明的是它們是 線性無關 的,這可以透過以下論據證明:它們是 線性無關 當且僅當 P {\displaystyle P} 可逆,根據可逆性與線性無關的關係命題可知。 ◻ {\displaystyle \Box }
接下來,我們將介紹一種方便的方法來找到 特徵值 。在此之前,我們先介紹一個與這種尋找特徵值的方法相關的術語。
示例. ( 1 2 4 4 5 2 0 0 9 ) {\displaystyle {\begin{pmatrix}1&2&4\\4&5&2\\0&0&9\\\end{pmatrix}}} 的特徵多項式 是 | 1 − t 2 4 4 5 − t 2 0 0 9 − t | = ( 9 − t ) | 1 − t 2 4 5 − t | = ( 9 − t ) [ ( 1 − t ) ( 5 − t ) − 2 ( 4 ) ] = − x 3 + 15 x 2 − 51 x − 27. {\displaystyle {\begin{vmatrix}1-t&2&4\\4&5-t&2\\0&0&9-t\\\end{vmatrix}}=(9-t){\begin{vmatrix}1-t&2\\4&5-t\\\end{vmatrix}}=(9-t)[(1-t)(5-t)-2(4)]=-x^{3}+15x^{2}-51x-27.} .
證明. λ is an eigenvalue of A ⇔ A v = λ v for some v ≠ 0 ⇔ ( A − λ I n ) v = 0 for some v ≠ 0 ⇔ A − λ I n is non-invertible by simplified invertible matrix theorem ⇔ det ( A − λ I n ) = 0 {\displaystyle {\begin{aligned}&&\lambda {\text{ is an }}&{\text{eigenvalue of }}A\\&\Leftrightarrow &A\mathbf {v} &=\lambda \mathbf {v} \qquad {\text{for some }}\mathbf {v} \neq \mathbf {0} \\&\Leftrightarrow &(A-\lambda I_{n})\mathbf {v} &=\mathbf {0} \qquad {\text{for some }}\mathbf {v} \neq \mathbf {0} \\&\Leftrightarrow &A-\lambda I_{n}&{\text{ is non-invertible}}\qquad {\text{by simplified invertible matrix theorem}}\\&\Leftrightarrow &\det(A-\lambda I_{n})&=0\end{aligned}}} .
◻ {\displaystyle \Box }
接下來,我們將介紹一個與特徵向量 相關的概念。
練習。
在介紹了這些術語和概念之後,我們有以下用於對 n × n {\displaystyle n\times n} 矩陣進行對角化的演算法步驟
透過求解 det ( A − λ I ) = 0 {\displaystyle \det(A-\lambda I)=0} 計算 A {\displaystyle A} 的所有 特徵值
對於矩陣 A {\displaystyle A} 的每個特徵值 λ 1 , … , λ k {\displaystyle \lambda _{1},\ldots ,\lambda _{k}} ,找到對應 特徵空間 E λ 1 , … , E λ k {\displaystyle E_{\lambda _{1}},\ldots ,E_{\lambda _{k}}} 的 基 β 1 , … , β k {\displaystyle \beta _{1},\ldots ,\beta _{k}} 。
如果 β 1 , … , β k {\displaystyle \beta _{1},\ldots ,\beta _{k}} 包含 n {\displaystyle n} 個向量 v 1 , … , v n {\displaystyle \mathbf {v} _{1},\ldots ,\mathbf {v} _{n}} (如果沒有,則 A {\displaystyle A} 不可對角化),定義 P = ( v 1 ⋯ v n ) {\displaystyle P={\begin{pmatrix}\mathbf {v} _{1}&\cdots &\mathbf {v} _{n}\end{pmatrix}}}
我們有 A = P D P − 1 {\displaystyle A=PDP^{-1}} ,其中 D {\displaystyle D} 是一個 對角 矩陣,其 對角 元素是對應於 v 1 , … , v n {\displaystyle \mathbf {v} _{1},\ldots ,\mathbf {v} _{n}} 的 特徵值 。
例子。 ( 2 × 2 {\displaystyle 2\times 2} 矩陣的對角化) 回憶一下動機部分的例子,給定矩陣 A = ( 19 − 8 48 − 21 ) {\displaystyle A={\begin{pmatrix}19&-8\\48&-21\\\end{pmatrix}}} 是可對角化的,並且它的 P D P − 1 {\displaystyle PDP^{-1}} 形式的表示式也被給出。我們將使用上述過程來推匯出給定的表示式。
首先, | 19 − λ − 8 48 − 21 − λ | = 0 ⟺ ( 19 − λ ) ( − 21 − λ ) + 8 ( 48 ) = 0 ⟹ λ 2 + 2 λ − 15 = 0 ⟺ λ = 3 or λ = − 5. {\displaystyle {\begin{vmatrix}19-\lambda &-8\\48&-21-\lambda \end{vmatrix}}=0\iff (19-\lambda )(-21-\lambda )+8(48)=0\implies \lambda ^{2}+2\lambda -15=0\iff \lambda =3{\text{ or }}\lambda =-5.} 所以,矩陣的特徵值為 λ = 3 {\displaystyle \lambda =3} 和 λ = − 5 {\displaystyle \lambda =-5} .
對於特徵值 λ = 3 {\displaystyle \lambda ={\color {green}3}} ,因為 ( A − 3 I ) x = 0 ⟹ ( 16 − 8 48 − 24 ) x = 0 {\displaystyle (A-3I)\mathbf {x} =\mathbf {0} \implies {\begin{pmatrix}16&-8\\48&-24\\\end{pmatrix}}\mathbf {x} =\mathbf {0} } ,並且可以證明其通解為 x = ( a , 2 a ) T {\displaystyle \mathbf {x} =(a,2a)^{T}} ,因此 E 3 {\displaystyle E_{3}} 的基為 { ( 1 , 2 ) T } {\displaystyle \{{\color {green}(1,2)^{T}}\}}
對於特徵值 λ = − 5 {\displaystyle \lambda ={\color {blue}-5}} ,因為 ( A + 5 I ) x = 0 ⟹ ( 24 − 8 48 − 16 ) x = 0 {\displaystyle (A+5I)\mathbf {x} =\mathbf {0} \implies {\begin{pmatrix}24&-8\\48&-16\\\end{pmatrix}}\mathbf {x} =\mathbf {0} } ,並且可以證明其通解為 x = ( b , 3 b ) T {\displaystyle \mathbf {x} =(b,3b)^{T}} ,因此 E − 5 {\displaystyle E_{-5}} 的基為 { ( 1 , 3 ) T } {\displaystyle \{{\color {blue}(1,3)^{T}}\}}
然後,我們令 P = ( 1 1 2 3 ) {\displaystyle P={\begin{pmatrix}{\color {green}1}&{\color {blue}1}\\{\color {green}2}&{\color {blue}3}\\\end{pmatrix}}} (因為兩個基底加起來包含兩個向量),並且 D = ( 3 0 0 − 5 ) . {\displaystyle D={\begin{pmatrix}{\color {green}3}&0\\0&{\color {blue}-5}\end{pmatrix}}.} 然後,我們可以計算得到 P − 1 = ( 3 − 1 − 2 1 ) . {\displaystyle P^{-1}={\begin{pmatrix}3&-1\\-2&1\\\end{pmatrix}}.} 因此,我們有 A = P D P − 1 = ( 1 1 2 3 ) ( 3 0 0 − 5 ) ( 3 − 1 − 2 1 ) , {\displaystyle A=PDP^{-1}={\begin{pmatrix}{\color {green}1}&{\color {blue}1}\\{\color {green}2}&{\color {blue}3}\\\end{pmatrix}}{\begin{pmatrix}{\color {green}3}&0\\0&{\color {blue}-5}\end{pmatrix}}{\begin{pmatrix}3&-1\\-2&1\\\end{pmatrix}},} 這與動機部分示例中給出的形式相同。一般來說,如果我們有 A = P D P − 1 {\displaystyle A=PDP^{-1}} , A n = P D n P − 1 , {\displaystyle A^{n}=PD^{n}P^{-1},} 這在動機部分的示例中有所說明。從動機部分的示例來看, A n = ( 3 n + 1 − 2 ( − 5 ) n ( − 5 ) n − 3 n 6 ( 3 n ) − 6 ( − 5 ) n 3 ( − 5 ) n − 2 ( 3 n ) ) . {\displaystyle A^{n}={\begin{pmatrix}3^{n+1}-2(-5)^{n}&(-5)^{n}-3^{n}\\6(3^{n})-6(-5)^{n}&3(-5)^{n}-2(3^{n})\\\end{pmatrix}}.}
示例: ( 3 × 3 {\displaystyle 3\times 3} 矩陣的對角化)考慮矩陣 A = ( 0 0 1 0 1 0 1 0 0 ) {\displaystyle A={\begin{pmatrix}0&0&1\\0&1&0\\1&0&0\\\end{pmatrix}}} (它不是 I 3 {\displaystyle I_{3}} )。我們希望找到一個關於 A n {\displaystyle A^{n}} 的公式。首先, | − λ 0 1 0 1 − λ 0 1 0 − λ | = 0 ⟹ λ 2 ( 1 − λ ) − ( 1 − λ ) = 0 ⟹ ( 1 − λ ) ( λ 2 − 1 ) = 0 ⟹ λ = 1 (repeated) or λ = − 1. {\displaystyle {\begin{vmatrix}-\lambda &0&1\\0&1-\lambda &0\\1&0&-\lambda \end{vmatrix}}=0\implies \lambda ^{2}(1-\lambda )-(1-\lambda )=0\implies (1-\lambda )(\lambda ^{2}-1)=0\implies \lambda =1{\text{(repeated) or }}\lambda =-1.} 因此,矩陣的特徵值為 λ = 1 {\displaystyle \lambda =1} 和 λ = − 1 {\displaystyle \lambda =-1} 。
對於特徵值 λ = 1 {\displaystyle \lambda ={\color {green}1}} ,由於 ( A − I ) x = 0 ⟹ ( − 1 0 1 0 0 0 1 0 − 1 ) x = 0 ⟹ x = ( b , a , b ) T = b ( 1 , 0 , 1 ) T + a ( 0 , 1 , 0 ) T , {\displaystyle (A-I)\mathbf {x} =\mathbf {0} \implies {\begin{pmatrix}-1&0&1\\0&0&0\\1&0&-1\end{pmatrix}}\mathbf {x} =\mathbf {0} \implies \mathbf {x} =(b,a,b)^{T}=b(1,0,1)^{T}+a(0,1,0)^{T},} (有兩個獨立的未知數,所以每個特徵空間的基的維數是 2 {\displaystyle 2} ,即每個基應該有兩個向量), E 1 {\displaystyle E_{1}} 的一個基是 { ( 1 , 0 , 1 ) T , ( 0 , 1 , 0 ) T } {\displaystyle \{{\color {green}(1,0,1)^{T}},{\color {green}(0,1,0)^{T}}\}} 。
對於特徵值 λ = − 1 {\displaystyle \lambda ={\color {blue}-1}} ,由於 ( A + I ) x = 0 ⟹ ( 1 0 1 0 2 0 1 0 1 ) x = 0 ⟹ x = ( c , 0 , − c ) T , {\displaystyle (A+I)\mathbf {x} =\mathbf {0} \implies {\begin{pmatrix}1&0&1\\0&2&0\\1&0&1\end{pmatrix}}\mathbf {x} =\mathbf {0} \implies \mathbf {x} =(c,0,-c)^{T},} , E − 1 {\displaystyle E_{-1}} 的一個基為 { ( 1 , 0 , − 1 ) T } {\displaystyle \{{\color {blue}(1,0,-1)^{T}}\}} .
Then, we let P = ( 1 0 1 0 1 0 1 0 − 1 ) {\displaystyle P={\begin{pmatrix}{\color {green}1}&{\color {green}0}&{\color {blue}1}\\{\color {green}0}&{\color {green}1}&{\color {blue}0}\\{\color {green}1}&{\color {green}0}&{\color {blue}-1}\end{pmatrix}}} , (since the two bases together contain three vectors) D = ( 1 0 0 0 1 0 0 0 − 1 ) {\displaystyle D={\begin{pmatrix}{\color {green}1}&0&0\\0&{\color {green}1}&0\\0&0&{\color {blue}-1}\end{pmatrix}}} (we have two eigenvectors corresponding to the eigenvalue λ = 1 {\displaystyle \lambda =1} , so this eigenvalue is repeated two times). Then, we can compute that P − 1 = ( 1 2 0 1 2 0 1 0 1 2 0 − 1 2 ) {\displaystyle P^{-1}={\begin{pmatrix}{\frac {1}{2}}&0&{\frac {1}{2}}\\0&1&0\\{\frac {1}{2}}&0&-{\frac {1}{2}}\end{pmatrix}}} . It follows that A = P D P − 1 = ( 1 0 1 0 1 0 1 0 − 1 ) ( 1 0 0 0 1 0 0 0 − 1 ) ( 1 2 0 1 2 0 1 0 1 2 0 − 1 2 ) , {\displaystyle A=PDP^{-1}={\begin{pmatrix}{\color {green}1}&{\color {green}0}&{\color {blue}1}\\{\color {green}0}&{\color {green}1}&{\color {blue}0}\\{\color {green}1}&{\color {green}0}&{\color {blue}-1}\end{pmatrix}}{\begin{pmatrix}{\color {green}1}&0&0\\0&{\color {green}1}&0\\0&0&{\color {blue}-1}\end{pmatrix}}{\begin{pmatrix}{\frac {1}{2}}&0&{\frac {1}{2}}\\0&1&0\\{\frac {1}{2}}&0&-{\frac {1}{2}}\end{pmatrix}},} and A n = P D n P − 1 = ( 1 0 1 0 1 0 1 0 − 1 ) ( 1 n 0 0 0 1 n 0 0 0 ( − 1 ) n ) ( 1 2 0 1 2 0 1 0 1 2 0 − 1 2 ) = ( 1 + ( − 1 ) n 2 0 1 − ( − 1 ) n 2 0 1 0 1 − ( − 1 ) n 2 0 1 + ( − 1 ) n 2 ) = { I 3 if n is even A if n is odd . {\displaystyle A^{n}=PD^{n}P^{-1}={\begin{pmatrix}{\color {green}1}&{\color {green}0}&{\color {blue}1}\\{\color {green}0}&{\color {green}1}&{\color {blue}0}\\{\color {green}1}&{\color {green}0}&{\color {blue}-1}\end{pmatrix}}{\begin{pmatrix}{\color {green}1}^{n}&0&0\\0&{\color {green}1}^{n}&0\\0&0&({\color {blue}-1})^{n}\end{pmatrix}}{\begin{pmatrix}{\frac {1}{2}}&0&{\frac {1}{2}}\\0&1&0\\{\frac {1}{2}}&0&-{\frac {1}{2}}\end{pmatrix}}={\begin{pmatrix}{\frac {1+(-1)^{n}}{2}}&0&{\frac {1-(-1)^{n}}{2}}\\0&1&0\\{\frac {1-(-1)^{n}}{2}}&0&{\frac {1+(-1)^{n}}{2}}\\\end{pmatrix}}={\begin{cases}I_{3}&{\text{if }}n{\text{ is even}}\\A&{\text{if }}n{\text{ is odd}}\end{cases}}.} This is an interesting result.
練習。
在接下來的內容中,我們將討論對角化的一些數學應用,包括推匯出序列公式以及求解 常微分方程 (ODE) 系統。
示例. (斐波那契數列) 考慮 斐波那契數列 F 0 , F 1 , … {\displaystyle F_{0},F_{1},\ldots } ,其中 F 0 = 0 {\displaystyle F_{0}=0} , F 1 = 1 {\displaystyle F_{1}=1} 以及對於每個非負整數 n {\displaystyle n} 有 F n + 2 = F n + 1 + F n {\displaystyle F_{n+2}=F_{n+1}+F_{n}} 。對於每個非負整數 n {\displaystyle n} ,這個遞推關係可以描述為 ( F n + 2 F n + 1 ) = ( 1 1 1 0 ) ( F n + 1 F n ) = ( F n + 1 + F n F n ) . {\displaystyle {\begin{pmatrix}F_{n+2}\\F_{n+1}\end{pmatrix}}={\begin{pmatrix}1&1\\1&0\\\end{pmatrix}}{\begin{pmatrix}F_{n+1}\\F_{n}\end{pmatrix}}={\begin{pmatrix}F_{n+1}+F_{n}\\F_{n}\end{pmatrix}}.}
令 A = ( 1 1 1 0 ) {\displaystyle A={\begin{pmatrix}1&1\\1&0\\\end{pmatrix}}} 。那麼, ( F n + 1 F n ) = A ( F n F n − 1 ) = A 2 ( F n − 1 F n − 2 ) = ⋯ = A n ( F 1 F 0 ) = A n ( 1 0 ) . {\displaystyle {\begin{pmatrix}F_{n+1}\\F_{n}\end{pmatrix}}=A{\begin{pmatrix}F_{n}\\F_{n-1}\end{pmatrix}}=A^{2}{\begin{pmatrix}F_{n-1}\\F_{n-2}\\\end{pmatrix}}=\cdots =A^{n}{\begin{pmatrix}F_{1}\\F_{0}\end{pmatrix}}=A^{n}{\begin{pmatrix}1\\0\\\end{pmatrix}}.}
為了得到 F n {\displaystyle F_{n}} 的表示式,只需要找到 A n {\displaystyle A^{n}} 的公式,我們可以透過對角化來找到它。
由於 | 1 − λ 1 1 − λ | = 0 ⟹ ( 1 − λ ) ( − λ ) − 1 = 0 ⟹ λ 2 − λ − 1 = 0 ⟹ λ = 1 + 5 2 or 1 − 5 2 . {\displaystyle {\begin{vmatrix}1-\lambda &1\\1&-\lambda \end{vmatrix}}=0\implies (1-\lambda )(-\lambda )-1=0\implies \lambda ^{2}-\lambda -1=0\implies \lambda ={\frac {1+{\sqrt {5}}}{2}}{\text{ or }}{\frac {1-{\sqrt {5}}}{2}}.} 令 φ = 1 + 5 2 {\displaystyle \varphi ={\frac {1+{\sqrt {5}}}{2}}} 為 黃金分割 , ψ = 1 − 5 2 {\displaystyle \psi ={\frac {1-{\sqrt {5}}}{2}}} 為 黃金分割 的 共軛 。
對於特徵值 λ = φ {\displaystyle \lambda ={\color {green}\varphi }} ,因為對於 ( 1 − φ 1 1 − φ ) x = 0 , {\displaystyle {\begin{pmatrix}1-\varphi &1\\1&-\varphi \end{pmatrix}}\mathbf {x} =\mathbf {0} ,} ,我們可以將表示此線性方程組的增廣矩陣轉換為行最簡形式如下: ( 1 − φ 1 0 1 − φ 0 ) → r 1 ↔ r 2 ( 1 − φ 0 1 − φ 1 0 ) → − ( 1 − φ ) r 1 + r 2 → r 2 ( 1 − φ 0 0 1 + φ − φ 2 0 ) = ( 1 − φ 0 0 0 0 ) . {\displaystyle {\begin{pmatrix}1-\varphi &1&0\\1&-\varphi &0\\\end{pmatrix}}{\overset {\mathbf {r} _{1}\leftrightarrow \mathbf {r} _{2}}{\to }}{\begin{pmatrix}1&-\varphi &0\\1-\varphi &1&0\\\end{pmatrix}}{\overset {-(1-\varphi )\mathbf {r} _{1}+\mathbf {r} _{2}\to \mathbf {r} _{2}}{\to }}{\begin{pmatrix}1&-\varphi &0\\0&1+\varphi -\varphi ^{2}&0\\\end{pmatrix}}={\begin{pmatrix}1&-\varphi &0\\0&0&0\\\end{pmatrix}}.} [ 3] 因此,通解是 x = ( a φ , a ) T {\displaystyle \mathbf {x} =(a\varphi ,a)^{T}} ,因此 E φ {\displaystyle E_{\varphi }} 的一個基是 { ( φ , 1 ) T } {\displaystyle \{{\color {green}(\varphi ,1)^{T}}\}} 。
對於特徵值 λ = ψ {\displaystyle \lambda ={\color {blue}\psi }} ,因為 ( 1 − ψ 1 1 − ψ ) x = 0 , {\displaystyle {\begin{pmatrix}1-\psi &1\\1&-\psi \end{pmatrix}}\mathbf {x} =\mathbf {0} ,} ,表示此線性方程組的增廣矩陣的行最簡形式是 ( 1 − ψ 0 0 0 0 ) {\displaystyle {\begin{pmatrix}1&-\psi &0\\0&0&0\\\end{pmatrix}}} ,這是由於對稱性[ 4] 。因此,通解是 x = ( b ψ , b ) T {\displaystyle \mathbf {x} =(b\psi ,b)^{T}} ,因此 E ψ {\displaystyle E_{\psi }} 的一個基是 { ( ψ , 1 ) T } {\displaystyle \{{\color {blue}(\psi ,1)^{T}}\}} 。
Then, we let P = ( φ ψ 1 1 ) {\displaystyle P={\begin{pmatrix}{\color {green}\varphi }&{\color {blue}\psi }\\{\color {green}1}&{\color {blue}1}\end{pmatrix}}} , D = ( φ 0 0 ψ ) {\displaystyle D={\begin{pmatrix}{\color {green}\varphi }&0\\0&{\color {blue}\psi }\end{pmatrix}}} . We can compute that P − 1 = 1 φ − ψ ( 1 − ψ − 1 φ ) {\displaystyle P^{-1}={\frac {1}{\varphi -\psi }}{\begin{pmatrix}1&-\psi \\-1&\varphi \end{pmatrix}}} Then, A = P D P − 1 {\displaystyle A=PDP^{-1}} , and thus A n = P D n P − 1 = 1 φ − ψ ( φ ψ 1 1 ) ( φ n 0 0 ψ n ) ( 1 − ψ − 1 φ ) = 1 φ − ψ ( φ n + 1 ψ n + 1 φ n ψ n ) ( 1 − ψ − 1 φ ) = 1 φ − ψ ( φ n + 1 − ψ n + 1 − ψ φ n + 1 + φ ψ n + 1 φ n − ψ n − ψ φ n + φ ψ n ) {\displaystyle A^{n}=PD^{n}P^{-1}={\frac {1}{\varphi -\psi }}{\begin{pmatrix}{\color {green}\varphi }&{\color {blue}\psi }\\{\color {green}1}&{\color {blue}1}\end{pmatrix}}{\begin{pmatrix}{\color {green}\varphi }^{n}&0\\0&{\color {blue}\psi }^{n}\end{pmatrix}}{\begin{pmatrix}1&-\psi \\-1&\varphi \end{pmatrix}}={\frac {1}{\varphi -\psi }}{\begin{pmatrix}\varphi ^{n+1}&\psi ^{n+1}\\\varphi ^{n}&\psi ^{n}\end{pmatrix}}{\begin{pmatrix}1&-\psi \\-1&\varphi \end{pmatrix}}={\frac {1}{\varphi -\psi }}{\begin{pmatrix}\varphi ^{n+1}-\psi ^{n+1}&-\psi \varphi ^{n+1}+\varphi \psi ^{n+1}\\\varphi ^{n}-\psi ^{n}&-\psi \varphi ^{n}+\varphi \psi ^{n}\end{pmatrix}}} Finally, we have ( F n + 1 F n ) = 1 φ − ψ ( φ n + 1 − ψ n + 1 − ψ φ n + 1 + φ ψ n + 1 φ n − ψ n − ψ φ n + φ ψ n ) ( 1 0 ) = 1 φ − ψ ( φ n + 1 − ψ n + 1 φ n − ψ n ) . {\displaystyle {\begin{pmatrix}F_{n+1}\\F_{n}\end{pmatrix}}={\frac {1}{\varphi -\psi }}{\begin{pmatrix}\varphi ^{n+1}-\psi ^{n+1}&-\psi \varphi ^{n+1}+\varphi \psi ^{n+1}\\\varphi ^{n}-\psi ^{n}&-\psi \varphi ^{n}+\varphi \psi ^{n}\end{pmatrix}}{\begin{pmatrix}1\\0\\\end{pmatrix}}={\frac {1}{\varphi -\psi }}{\begin{pmatrix}\varphi ^{n+1}-\psi ^{n+1}\\\varphi ^{n}-\psi ^{n}\end{pmatrix}}.} Thus, F n = φ n − ψ n φ − ψ {\displaystyle F_{n}={\frac {\varphi ^{n}-\psi ^{n}}{\varphi -\psi }}} in which φ = 1 + 5 2 {\displaystyle \varphi ={\frac {1+{\sqrt {5}}}{2}}} and ψ = 1 − 5 2 {\displaystyle \psi ={\frac {1-{\sqrt {5}}}{2}}} .
示例. (常微分方程組) 考慮常微分方程組 { d x d t = 2 x − 3 y d y d t = 4 x − 5 y {\displaystyle {\begin{cases}{\frac {dx}{dt}}&=2x-3y\\{\frac {dy}{dt}}&=4x-5y\\\end{cases}}} ,初始條件為 ( x , y ) = ( 1 , 2 ) {\displaystyle (x,y)=(1,2)} ,當 t = 0 {\displaystyle t=0} 。
Using the dot notation for differentiation, the system can be rewritten as ( x ˙ y ˙ ) = A ( x y ) {\displaystyle {\begin{pmatrix}{\dot {x}}\\{\dot {y}}\end{pmatrix}}=A{\begin{pmatrix}x\\y\end{pmatrix}}} in which A = ( 2 − 3 4 − 5 ) {\displaystyle A={\begin{pmatrix}2&-3\\4&-5\\\end{pmatrix}}} . Suppose we can write A = P D P − 1 ⟺ D = P − 1 A P {\displaystyle A=PDP^{-1}\iff D=P^{-1}AP} in which P {\displaystyle P} is an invertible matrix and D {\displaystyle D} is a diagonal matrix. Let P − 1 = ( a b c d ) {\displaystyle P^{-1}={\begin{pmatrix}a&b\\c&d\\\end{pmatrix}}} in which a , b , c , d {\displaystyle a,b,c,d} are some real numbers. Also, let ( u v ) = P − 1 ( x y ) = ( a b c d ) = ( a x + b y c x + d y ) {\displaystyle {\begin{pmatrix}u\\v\\\end{pmatrix}}=P^{-1}{\begin{pmatrix}x\\y\\\end{pmatrix}}={\begin{pmatrix}a&b\\c&d\\\end{pmatrix}}={\begin{pmatrix}ax+by\\cx+dy\\\end{pmatrix}}} , which implies u = a x + b y {\displaystyle u=ax+by} and v = c x + d y {\displaystyle v=cx+dy} , and ( x y ) = P ( u v ) {\displaystyle {\begin{pmatrix}x\\y\\\end{pmatrix}}=P{\begin{pmatrix}u\\v\end{pmatrix}}} . It follows that u ˙ = a x ˙ + b y ˙ {\displaystyle {\dot {u}}=a{\dot {x}}+b{\dot {y}}} and v ˙ = c x ˙ + d y ˙ {\displaystyle {\dot {v}}=c{\dot {x}}+d{\dot {y}}} . Thus, ( u ˙ v ˙ ) = ( a b c d ) ( x ˙ y ˙ ) = P − 1 ( x ˙ y ˙ ) = P − 1 A ( x y ) = P − 1 A P ( u v ) = D ( u v ) . {\displaystyle {\begin{pmatrix}{\dot {u}}\\{\dot {v}}\end{pmatrix}}={\begin{pmatrix}a&b\\c&d\\\end{pmatrix}}{\begin{pmatrix}{\dot {x}}\\{\dot {y}}\end{pmatrix}}=P^{-1}{\begin{pmatrix}{\dot {x}}\\{\dot {y}}\end{pmatrix}}=P^{-1}A{\begin{pmatrix}x\\y\\\end{pmatrix}}=P^{-1}AP{\begin{pmatrix}u\\v\\\end{pmatrix}}=D{\begin{pmatrix}u\\v\end{pmatrix}}.} Let D = ( d 1 0 0 d 2 ) {\displaystyle D={\begin{pmatrix}d_{1}&0\\0&d_{2}\end{pmatrix}}} , then the system can be simplified to { d u d t = d 1 u d v d t = d 2 v ⟹ { 1 u d u = d 1 d t 1 v d v = d 2 d t ⟹ { ∫ 1 u d u = ∫ d 1 d t ∫ 1 v d v = ∫ d 2 d t ⟹ { ln | u | = d 1 t + C 1 ln | v | = d 2 t + C 2 ⟹ { u = ± e d 1 t + C 1 v = ± e d 2 t + C 2 ⟹ { u = C 3 e d 1 t v = C 4 e d 2 t {\displaystyle {\begin{cases}{\frac {du}{dt}}&=d_{1}u\\{\frac {dv}{dt}}&=d_{2}v\end{cases}}\implies {\begin{cases}{\frac {1}{u}}\,du&=d_{1}\,dt\\{\frac {1}{v}}\,dv&=d_{2}\,dt\end{cases}}\implies {\begin{cases}\int {\frac {1}{u}}\,du&=\int d_{1}\,dt\\\int {\frac {1}{v}}\,dv&=\int d_{2}\,dt\end{cases}}\implies {\begin{cases}\ln |u|&=d_{1}t+C_{1}\\\ln |v|&=d_{2}t+C_{2}\end{cases}}\implies {\begin{cases}u&=\pm e^{d_{1}t+C_{1}}\\v&=\pm e^{d_{2}t+C_{2}}\end{cases}}\implies {\begin{cases}u&=C_{3}e^{d_{1}t}\\v&=C_{4}e^{d_{2}t}\end{cases}}} in which C 1 , C 2 {\displaystyle C_{1},C_{2}} are arbitrary constants, and C 3 = ± e C 1 , C 4 = ± e C 2 {\displaystyle C_{3}=\pm e^{C_{1}},C_{4}=\pm e^{C_{2}}} .
然後,我們透過對角化 A {\displaystyle A} 來求解 D {\displaystyle D} : | 2 − λ − 3 4 − 5 − λ | = 0 ⟹ ( 2 − λ ) ( − 5 − λ ) + 12 = 0 ⟹ λ 2 + 3 λ + 2 = 0 ⟹ λ = − 1 or λ = − 2. {\displaystyle {\begin{vmatrix}2-\lambda &-3\\4&-5-\lambda \end{vmatrix}}=0\implies (2-\lambda )(-5-\lambda )+12=0\implies \lambda ^{2}+3\lambda +2=0\implies \lambda =-1{\text{ or }}\lambda =-2.} 對於特徵值 λ = − 1 {\displaystyle \lambda =-1} , ( 3 − 3 4 − 4 ) x = 0 , {\displaystyle {\begin{pmatrix}3&-3\\4&-4\end{pmatrix}}\mathbf {x} =\mathbf {0} ,} ,其通解為 x = ( s , s ) T {\displaystyle \mathbf {x} =(s,s)^{T}} ,因此 E − 1 = { ( 1 , 1 ) T } {\displaystyle E_{-1}=\{(1,1)^{T}\}} 的一個基。
對於特徵值 λ = − 2 {\displaystyle \lambda =-2} , ( 4 − 3 4 − 3 ) x = 0 , {\displaystyle {\begin{pmatrix}4&-3\\4&-3\end{pmatrix}}\mathbf {x} =\mathbf {0} ,} ,其通解為 x = ( t , 4 t / 3 ) T {\displaystyle \mathbf {x} =(t,4t/3)^{T}} ,因此 E − 2 = { ( 1 , 4 / 3 ) T } {\displaystyle E_{-2}=\{(1,4/3)^{T}\}} 的基底為。
然後,令 P = ( 1 1 1 4 3 ) {\displaystyle P={\begin{pmatrix}1&1\\1&{\frac {4}{3}}\end{pmatrix}}} 以及 D = ( − 1 0 0 − 2 ) {\displaystyle D={\begin{pmatrix}-1&0\\0&-2\end{pmatrix}}} 。由此可知, P − 1 = ( 4 − 3 − 3 3 ) {\displaystyle P^{-1}={\begin{pmatrix}4&-3\\-3&3\end{pmatrix}}} 。然後, A = P D P − 1 {\displaystyle A=PDP^{-1}} 。
因此, d 1 = − 1 {\displaystyle d_{1}=-1} 和 d 2 = − 2 {\displaystyle d_{2}=-2} ,所以 u = C 3 e − t {\displaystyle u=C_{3}e^{-t}} 和 v = C 4 e − 2 t {\displaystyle v=C_{4}e^{-2t}} 。應用初始條件 ( x , y ) = ( 1 , 2 ) {\displaystyle (x,y)=(1,2)} 當 t = 0 {\displaystyle t=0} 時, ( u v ) = P − 1 ( 1 2 ) = ( 4 − 3 − 3 3 ) ( 1 3 ) = ( − 2 3 ) {\displaystyle {\begin{pmatrix}u\\v\\\end{pmatrix}}=P^{-1}{\begin{pmatrix}1\\2\\\end{pmatrix}}={\begin{pmatrix}4&-3\\-3&3\end{pmatrix}}{\begin{pmatrix}1\\3\\\end{pmatrix}}={\begin{pmatrix}-2\\3\end{pmatrix}}} 當 t = 0 {\displaystyle t=0} 時,這意味著 u = − 2 e − t {\displaystyle u=-2e^{-t}} 和 v = 3 e − 2 t {\displaystyle v=3e^{-2t}} 。因此, ( x y ) = P ( u v ) = ( 1 1 1 4 3 ) ( − 2 e − t 3 e − 2 t ) = ( 3 e − 2 t − 2 e − t 4 e − 2 t − 2 e − t ) . {\displaystyle {\begin{pmatrix}x\\y\end{pmatrix}}=P{\begin{pmatrix}u\\v\end{pmatrix}}={\begin{pmatrix}1&1\\1&{\frac {4}{3}}\end{pmatrix}}{\begin{pmatrix}-2e^{-t}\\3e^{-2t}\end{pmatrix}}={\begin{pmatrix}3e^{-2t}-2e^{-t}\\4e^{-2t}-2e^{-t}\end{pmatrix}}.} 因此,此微分方程組的解為 ( x , y ) = ( 3 e − 2 t − 2 e − t , 4 e − 2 t − 2 e − t ) . {\displaystyle (x,y)=(3e^{-2t}-2e^{-t},4e^{-2t}-2e^{-t}).}
練習。
↑ 但即使 A {\displaystyle A} 具有嚴格少於 n {\displaystyle n} 個特徵值, A {\displaystyle A} 仍然可以是對角化的。實際上, A {\displaystyle A} 最多有 n {\displaystyle n} 個不同的特徵值,因為 λ {\displaystyle \lambda } 的特徵多項式是 λ {\displaystyle \lambda } 的 n {\displaystyle n} 次多項式,根據代數基本定理,它有 n {\displaystyle n} 個根(其中一些可能重複)。
↑ 它是複數 1 + 2 i {\displaystyle 1+2i} 的矩陣表示形式。
↑ 1 + φ − φ 2 = 0 {\displaystyle 1+\varphi -\varphi ^{2}=0} 因為 1 + φ − φ = − ( φ 2 − φ − 1 ⏟ 0 ) = 0 {\displaystyle 1+\varphi -\varphi =-(\underbrace {\varphi ^{2}-\varphi -1} _{0})=0}
↑ 特別地, 1 + φ − φ 2 = 1 + ψ − ψ 2 = 0. {\displaystyle 1+\varphi -\varphi ^{2}=1+\psi -\psi ^{2}=0.} ,因為 φ , ψ {\displaystyle \varphi ,\psi } 都滿足方程 λ 2 − λ − 1 = 0 {\displaystyle \lambda ^{2}-\lambda -1=0} .