特徵值和特徵向量與矩陣的基本屬性有關。
- “特徵值”一詞來自德語“Eigenwert”,意思是“適當的或特徵的價值”。
大型矩陣在計算時間方面可能很昂貴,並且可能需要進行數百或數千次迭代才能進行計算。此外,在沒有重要數學工具的情況下,矩陣的行為將難以探索。一個數學工具,不僅對線性代數有應用,而且對微分方程、微積分和許多其他領域也有應用,那就是特徵值和特徵向量的概念。特徵值和特徵向量基於線性系統中的常見行為。讓我們看一個例子。
讓

和

如果A轉換x和y會發生什麼?好吧,


但值得注意的是


因此,當我們用矩陣A對向量x進行操作時,我們不會得到一個不同的向量(就像我們通常做的那樣),而是得到相同的向量x乘以某個常數。向量y也是如此。
我們將值 1 和 -2 稱為矩陣A的特徵值,而向量x和y稱為矩陣A的特徵向量。
我們現在將這種矩陣/向量乘積與上面標量乘積相同的概念推廣:本質上,如果我們有一個n×n矩陣 A,我們在v中尋找解以找到特徵向量,並在λ中尋找解以找到方程的特徵值
- Av=λv
我們該怎麼做呢?讓我們重新排列方程
- Av-λv=0
- (A-λI)v=0(注意我們必須將標量乘以單位矩陣,否則 A-λ 毫無意義)
但是 (A-λI) 是一個矩陣,所以我們試圖解決 Bv=0,其中 B=(A-λI),而這個解僅僅是 B 的核,ker B。因此,特徵向量位於 ker (A-λI) 中,其中 λ 是一個特徵值。但我們如何找到特徵值呢?
Bv=0 具有非零解,如果 |B| = det(B) 為零。因此,為了找到特徵值,我們讓 |A-λI|=0,然後求解 λ。因此,我們將獲得一個關於複數的多項式方程(特徵值可以是複數),稱為特徵方程。特徵方程的根是特徵值。
注意,我們排除0 作為特徵向量,因為它平凡地是 Av=λv 的解,而且實際上我們並不關心它。此外,如果將零向量包括在內,它將允許無限多個特徵值,因為 λ 的任何值都滿足 A0=λ0。
如果我們有一個矩陣 A 的特徵值 λ,以及相應的特徵向量x,那麼x的任何倍數也是相同特徵值的特徵向量。要看到 kx 也是一個特徵向量,請遵循此論點:如果 Ax=λx,那麼 A(kx)=kAx=kλx=λ(kx)。(這裡 k 可以是任何標量。)因此,特徵向量的每個倍數也是一個特徵向量。
注意這裡的非對稱性:特徵值是唯一的,而一個特徵值有多個特徵向量。</gallery> </gallery> </gallery> 粗體文字Æə=== 查詢特徵值和特徵向量 === 以下是一些使用我們的定義查詢特徵值和特徵向量的示例。
讓

首先,我們將 |A-λI|=0 展開以求得特徵值




現在,初等代數告訴我們這個方程的根是 3 和 2,因此它們是我們的特徵值。
(練習:證明在 2×2 三角矩陣中,特徵值位於主對角線上。更難的是:推廣這個結果)
現在我們可以找到我們的特徵向量。考慮第一個特徵值 λ=3。為了找到我們的第一個特徵向量

在這一點上我們可以進行行變換和回代,但通常猜測核就足夠了,因為我們的矩陣很小,並且我們有線性相關的列。現在,觀察

因此,對於任何標量 a,向量
是一個特徵向量。換句話說,矩陣 A 的所有特徵向量的集合包括集合
。在平面上,這表示一條斜率為 -1,透過原點的直線。
如上所述,矩陣的特徵值是唯一確定的,但對於每個特徵值,都有許多特徵向量。我們通常選擇一個特徵向量,以便“大多數條目為整數”、“第一個條目為 1”或“特徵向量的長度為 1”。大多數計算機代數系統為特徵向量選擇單位向量。
因此,在這裡我們可以取
作為特徵向量,例如。
類似地,對於我們的第二個特徵值 λ=2,為了找到我們的第二個特徵向量

因此,我們選擇第二個特徵向量為

我們的特徵值為λ=2,3,特徵向量為
,可以透過將每個向量與給定矩陣相乘進行驗證。
(我們也可以選擇
作為特徵值λ=3的特徵向量。請驗證一下。)
根據以上內容,求解以下矩陣的特徵值和特徵向量(偶數題答案在後面給出)



- (較難。提示:一個特徵值為4。)
- 特徵值:3, 5; 特徵向量:

- 特徵值:-2, 2; 特徵向量:

- 特徵值: -3, 1, 4;特徵向量:

特徵值和特徵向量不僅僅是關於這些向量的漂亮事實;它們具有相關且重要的應用。
讓我們首先考察一類稱為對角矩陣的矩陣:這些矩陣的形式為

現在,觀察到

這是一個有用的性質!但是,我們可以應用此事實的矩陣數量顯然是有限的,所以我們問自己是否可以將給定矩陣轉換為對角矩陣。
這個問題的答案是“有時”,但目前,我們只關注答案為“是”的矩陣。
我們尋找的是一個矩陣 P 使得
- PAP-1=D
其中 D 是對角矩陣。
如果這樣的矩陣 P 存在,我們就說 A 是可對角化的。(注意,xyx-1 通常被稱為相似變換)。
那麼
- PAP-1=D
- AP-1=P-1D
透過將整個公式乘以 P-1,然後
- A=P-1DP
透過將公式乘以 P。
現在,我們有
- Ak=(P-1DP)k
- =(P-1DP)(P-1DP)(P-1DP)... (k 次)
- =P-1D(PP-1)D(PP-1)DP... (k 次)
PP-1 項相互抵消,得到
- =P-1DDD...P (k 次)
- =P-1DkP
我們可以很容易地計算出 Dk,所以我們需要找到 P。
事實證明(整個證明相當困難),我們只需要從連線線性無關的特徵向量來建立一個矩陣來建立 P。
然後,D 是一個對角矩陣,其中主對角線包含與相關特徵向量相對應的特徵值(第一個位置的特徵值對應於它所建立的特徵向量,在第一列)。
讓我們透過一個示例來展示這些想法。

所以,如果我們想找到 A14,我們該怎麼做?讓我們使用我們剛剛描述的方法。
找到特徵值
- |A-λI|=0
- (3-λ)(-λ)-4=0
- λ2-3λ-4=0
- λ=-1, 4
找到特徵向量
- 對於 λ=-1

- 對於 λ=4

那麼,特徵向量為

因此,將特徵向量組合起來形成矩陣 P

現在,-1 生成第一列中的特徵向量,而 4 生成第二列中的特徵向量,因此按照這種方式形成 D

我們可以很容易地計算 (-1)14=1,因此我們得到

並且我們有用於建立 2×2 矩陣的逆矩陣的快速方法

所以現在我們可以直接將它們相乘

簡化後,我們得到

根據以上內容,求解以下矩陣冪(偶數編號問題的答案如下)




- (更繁瑣:只因為這個矩陣是行階梯形式,所以只有一點點更容易)
- 2.

- 4.

我們可以使用對角化方法來求解耦合常微分方程。例如,令 x(t) 和 y(t) 是可微函式,x' 和 y' 是它們的導數。微分方程相對難以求解
- x' = 4x - y
- y' = 2x + y
但是
- 對於常數 k,u' = ku 很容易求解
它的解是
- u = Aekx 其中 A 是一個常數
記住這個事實,我們將 ODE 轉換為矩陣形式

對角化方陣,我們得到

我們放入

然後它隨之而來

因此

如上所述,解決方案很簡單。我們有


其中 C 和 D 是常數。現在我們有

得到

因此


這種方法可以很好地推廣到更高維度。
奇怪的是,矩陣在微積分中與聯立微分方程的解的計算有很大的關係,其中一個微分方程的函式依賴於另一個微分方程。例如
- D y = 3y + x
- D x = y + 3x
不用再深入研究,這些微分方程的解看起來很複雜!但是,如果我們用矩陣的形式來表達,分析起來會容易一些。
讓我們以上面的例子為例,所以
- D y(t) = 3y + x
- D x(t) = y + 3x
現在形成一個向量

那麼

現在問題變成了

這讓人想起我們在微積分中已經遇到的微分方程,即
- D y = ky
其中解為 y = cekt。我們可以大膽猜測上面的矩陣方程的解將具有類似的形式。
所以讓我們嘗試一個解 v = weλt。然後 D v = λweλt。
然後讓我們嘗試將這個猜想解代入我們的方程

如果我們設

我們看到上面的方程在除以
(因為它永遠不等於零)後變成

但是等等——這是找到特徵值的方程式,並且我們有解 **v** = **w**eλt 是一個解,當且僅當 λ 是 A 的特徵值並且 **w** 是其對應的特徵向量。
特徵值為 4, 2,特徵向量分別為

。
因此,我們有兩個解

和

請注意,如果我們對微分方程 D **v** = A**v** 有兩個解,那麼這兩個解的線性組合將給出相同的解。所以我們有下面的通解


將它們分成第一個和第二個分量,我們得到兩個解
.
根據上述內容,解決以下問題(偶數題答案如下)
- 求 y(t) 和 x(t),其中 D y(t)=3x(t)+6y(t) 且 D x(t)=x(t)+4y(t)
- 求 y(t) 和 x(t),其中 D y(t)=2x(t)+2y(t) 且 D x(t)=x(t)-2y(t)
構成矩陣

該矩陣的特徵值為

特徵向量為

所以現在

並且 y(t) 和 x(t) 可以透過觀察直接得出。