跳轉到內容

線性代數/特徵值和特徵向量

來自華夏公益教科書,開放的書籍,開放的世界

特徵值和特徵向量與矩陣的基本屬性有關。

“特徵值”一詞來自德語“Eigenwert”,意思是“適當的或特徵的價值”。

大型矩陣在計算時間方面可能很昂貴,並且可能需要進行數百或數千次迭代才能進行計算。此外,在沒有重要數學工具的情況下,矩陣的行為將難以探索。一個數學工具,不僅對線性代數有應用,而且對微分方程、微積分和許多其他領域也有應用,那就是特徵值特徵向量的概念。特徵值和特徵向量基於線性系統中的常見行為。讓我們看一個例子。

如果A轉換xy會發生什麼?好吧,

但值得注意的是

因此,當我們用矩陣A對向量x進行操作時,我們不會得到一個不同的向量(就像我們通常做的那樣),而是得到相同的向量x乘以某個常數。向量y也是如此。

我們將值 1 和 -2 稱為矩陣A特徵值,而向量xy稱為矩陣A特徵向量

我們現在將這種矩陣/向量乘積與上面標量乘積相同的概念推廣:本質上,如果我們有一個n×n矩陣 A,我們在v中尋找解以找到特徵向量,並在λ中尋找解以找到方程的特徵值

Avv

我們該怎麼做呢?讓我們重新排列方程

Avv=0
(A-λI)v=0注意我們必須將標量乘以單位矩陣,否則 A-λ 毫無意義

但是 (A-λI) 是一個矩陣,所以我們試圖解決 Bv=0,其中 B=(A-λI),而這個解僅僅是 B 的核,ker B。因此,特徵向量位於 ker (A-λI) 中,其中 λ 是一個特徵值。但我們如何找到特徵值呢?

Bv=0 具有非零解,如果 |B| = det(B) 為零。因此,為了找到特徵值,我們讓 |A-λI|=0,然後求解 λ。因此,我們將獲得一個關於複數的多項式方程(特徵值可以是複數),稱為特徵方程。特徵方程的根是特徵值。

注意,我們排除0 作為特徵向量,因為它平凡地是 Avv 的解,而且實際上我們並不關心它。此外,如果將零向量包括在內,它將允許無限多個特徵值,因為 λ 的任何值都滿足 A00

如果我們有一個矩陣 A 的特徵值 λ,以及相應的特徵向量x,那麼x的任何倍數也是相同特徵值的特徵向量。要看到 kx 也是一個特徵向量,請遵循此論點:如果 Axx,那麼 A(kx)=kAx=kλx=λ(kx)。(這裡 k 可以是任何標量。)因此,特徵向量的每個倍數也是一個特徵向量。

注意這裡的非對稱性:特徵值是唯一的,而一個特徵值有多個特徵向量。</gallery> </gallery> </gallery> 粗體文字Æə=== 查詢特徵值和特徵向量 === 以下是一些使用我們的定義查詢特徵值和特徵向量的示例。

首先,我們將 |A-λI|=0 展開以求得特徵值


現在,初等代數告訴我們這個方程的根是 3 和 2,因此它們是我們的特徵值。

(練習:證明在 2×2 三角矩陣中,特徵值位於主對角線上。更難的是:推廣這個結果)

現在我們可以找到我們的特徵向量。考慮第一個特徵值 λ=3。為了找到我們的第一個特徵向量

在這一點上我們可以進行行變換和回代,但通常猜測核就足夠了,因為我們的矩陣很小,並且我們有線性相關的列。現在,觀察

因此,對於任何標量 a,向量

是一個特徵向量。換句話說,矩陣 A 的所有特徵向量的集合包括集合 。在平面上,這表示一條斜率為 -1,透過原點的直線。

如上所述,矩陣的特徵值是唯一確定的,但對於每個特徵值,都有許多特徵向量。我們通常選擇一個特徵向量,以便“大多數條目為整數”、“第一個條目為 1”或“特徵向量的長度為 1”。大多數計算機代數系統為特徵向量選擇單位向量。

因此,在這裡我們可以取 作為特徵向量,例如。

類似地,對於我們的第二個特徵值 λ=2,為了找到我們的第二個特徵向量

因此,我們選擇第二個特徵向量為

我們的特徵值為λ=2,3,特徵向量為,可以透過將每個向量與給定矩陣相乘進行驗證。

(我們也可以選擇作為特徵值λ=3的特徵向量。請驗證一下。)

問題集

[edit | edit source]

根據以上內容,求解以下矩陣的特徵值和特徵向量(偶數題答案在後面給出)

(較難。提示:一個特徵值為4。)

答案

[edit | edit source]
  1. 特徵值:3, 5; 特徵向量:
  2. 特徵值:-2, 2; 特徵向量:
  3. 特徵值: -3, 1, 4;特徵向量:

特徵值和特徵向量不僅僅是關於這些向量的漂亮事實;它們具有相關且重要的應用。

矩陣冪

[編輯 | 編輯原始碼]

讓我們首先考察一類稱為對角矩陣的矩陣:這些矩陣的形式為

現在,觀察到

這是一個有用的性質!但是,我們可以應用此事實的矩陣數量顯然是有限的,所以我們問自己是否可以將給定矩陣轉換為對角矩陣。

這個問題的答案是“有時”,但目前,我們只關注答案為“是”的矩陣。

我們尋找的是一個矩陣 P 使得

PAP-1=D

其中 D 是對角矩陣。

如果這樣的矩陣 P 存在,我們就說 A 是可對角化的。(注意,xyx-1 通常被稱為相似變換)。

那麼

PAP-1=D
AP-1=P-1D

透過將整個公式乘以 P-1,然後

A=P-1DP

透過將公式乘以 P。

現在,我們有

Ak=(P-1DP)k
=(P-1DP)(P-1DP)(P-1DP)... (k 次)
=P-1D(PP-1)D(PP-1)DP... (k 次)

PP-1 項相互抵消,得到

=P-1DDD...P (k 次)
=P-1DkP

我們可以很容易地計算出 Dk,所以我們需要找到 P。

事實證明(整個證明相當困難),我們只需要從連線線性無關的特徵向量來建立一個矩陣來建立 P。

然後,D 是一個對角矩陣,其中主對角線包含與相關特徵向量相對應的特徵值(第一個位置的特徵值對應於它所建立的特徵向量,在第一列)。

讓我們透過一個示例來展示這些想法。

所以,如果我們想找到 A14,我們該怎麼做?讓我們使用我們剛剛描述的方法。

找到特徵值

|A-λI|=0
(3-λ)(-λ)-4=0
λ2-3λ-4=0
λ=-1, 4

找到特徵向量

對於 λ=-1
對於 λ=4

那麼,特徵向量為

因此,將特徵向量組合起來形成矩陣 P

現在,-1 生成第一列中的特徵向量,而 4 生成第二列中的特徵向量,因此按照這種方式形成 D

我們可以很容易地計算 (-1)14=1,因此我們得到

並且我們有用於建立 2×2 矩陣的逆矩陣的快速方法

所以現在我們可以直接將它們相乘

簡化後,我們得到

問題集

[edit | edit source]

根據以上內容,求解以下矩陣冪(偶數編號問題的答案如下)

(更繁瑣:只因為這個矩陣是行階梯形式,所以只有一點點更容易)
2.
4.

耦合常微分方程

[編輯 | 編輯原始碼]

我們可以使用對角化方法來求解耦合常微分方程。例如,令 x(t) 和 y(t) 是可微函式,x' 和 y' 是它們的導數。微分方程相對難以求解

x' = 4x - y
y' = 2x + y

但是

對於常數 k,u' = ku 很容易求解

它的解是

u = Aekx 其中 A 是一個常數

記住這個事實,我們將 ODE 轉換為矩陣形式

對角化方陣,我們得到

我們放入

然後它隨之而來

因此

如上所述,解決方案很簡單。我們有

其中 C 和 D 是常數。現在我們有

得到

因此

這種方法可以很好地推廣到更高維度。

聯立微分方程

[edit | edit source]

奇怪的是,矩陣在微積分中與聯立微分方程的解的計算有很大的關係,其中一個微分方程的函式依賴於另一個微分方程。例如

D y = 3y + x
D x = y + 3x

不用再深入研究,這些微分方程的解看起來很複雜!但是,如果我們用矩陣的形式來表達,分析起來會容易一些。

示例

[edit | edit source]

讓我們以上面的例子為例,所以

D y(t) = 3y + x
D x(t) = y + 3x

現在形成一個向量

那麼

現在問題變成了

這讓人想起我們在微積分中已經遇到的微分方程,即

D y = ky

其中解為 y = cekt。我們可以大膽猜測上面的矩陣方程的解將具有類似的形式。

所以讓我們嘗試一個解 v = weλt。然後 D v = λweλt

然後讓我們嘗試將這個猜想解代入我們的方程

如果我們設

我們看到上面的方程在除以(因為它永遠不等於零)後變成

但是等等——這是找到特徵值的方程式,並且我們有解 **v** = **w**eλt 是一個解,當且僅當 λ 是 A 的特徵值並且 **w** 是其對應的特徵向量。

特徵值為 4, 2,特徵向量分別為

因此,我們有兩個解

請注意,如果我們對微分方程 D **v** = A**v** 有兩個解,那麼這兩個解的線性組合將給出相同的解。所以我們有下面的通解

將它們分成第一個和第二個分量,我們得到兩個解

.

問題集

[edit | edit source]

根據上述內容,解決以下問題(偶數題答案如下)

  1. 求 y(t) 和 x(t),其中 D y(t)=3x(t)+6y(t) 且 D x(t)=x(t)+4y(t)
  2. 求 y(t) 和 x(t),其中 D y(t)=2x(t)+2y(t) 且 D x(t)=x(t)-2y(t)
答案
[edit | edit source]

構成矩陣

該矩陣的特徵值為

特徵向量為

所以現在

並且 y(t) 和 x(t) 可以透過觀察直接得出。

[編輯 | 編輯原始碼]
華夏公益教科書