事實證明,線性變換可以在矩陣中以一對一的方式表示。本章很可能是回顧,因為這個主題可能已經在高中學習過(請參見此連結 )。在對線性變換的研究中,建立線性變換和矩陣之間的一對一對應關係非常重要。
假設您有一個向量空間 X 的一組基向量 x1 、x2 、x3 、...、xm 和一個向量空間 Y 的一組基向量 y1 、y2 、y3 、...、yn 。
考慮從 X 到 Y 的線性變換 T,以及向量
T(x1 )=y1 a11 +y2 a21 +y3 a31 +...+yn an1 , T(x2 )=y1 a12 +y2 a22 +y3 a32 +...+yn an2 , T(x3 )=y1 a13 +y2 a23 +y3 a33 +...+yn an3 ,
... T(xm )=y1 a1m +y2 a2m +y3 a3m +...+yn anm ,
您可以將這些係數排列在一個矩陣中
M = ( a 11 a 12 a 13 … a 1 m a 21 a 22 a 23 … a 2 m a 31 a 32 a 33 … a 3 m ⋮ ⋮ ⋮ ⋮ ⋮ a n 1 a n 2 a n 3 … a n m ) {\displaystyle M={\begin{pmatrix}a_{11}&a_{12}&a_{13}&\ldots &a_{1m}\\a_{21}&a_{22}&a_{23}&\ldots &a_{2m}\\a_{31}&a_{32}&a_{33}&\ldots &a_{3m}\\\vdots &\vdots &\vdots &\vdots &\vdots \\a_{n1}&a_{n2}&a_{n3}&\ldots &a_{nm}\\\end{pmatrix}}} .
因此,如果您有任何向量
x = ∑ j = 1 m x j b j {\displaystyle x=\sum _{j=1}^{m}x_{j}b_{j}} ,
然後
T ( x ) = T ( ∑ j = 1 m x j b j ) = ∑ j = 1 m b j T ( x j ) = ∑ j = 1 m b j ∑ i = 1 n y i a i j = ∑ i = 1 n y i ∑ j = 1 m a i j b j {\displaystyle T(x)=T(\sum _{j=1}^{m}x_{j}b_{j})=\sum _{j=1}^{m}b_{j}T(x_{j})=\sum _{j=1}^{m}b_{j}\sum _{i=1}^{n}y_{i}a_{ij}=\sum _{i=1}^{n}y_{i}\sum _{j=1}^{m}a_{ij}b_{j}}
因此,T(x) 是基向量的線性組合
∑ i = 1 n y n c i {\displaystyle \sum _{i=1}^{n}y_{n}c_{i}} , 其中
c i = ∑ j = 1 m a i j b j {\displaystyle c_{i}=\sum _{j=1}^{m}a_{ij}b_{j}} .
因此,關於基的矩陣的知識可以確定線性變換結果的值。
因此,給定任何矩陣,都有一個對應的函式,其結果為
∑ i = 1 n y n c i {\displaystyle \sum _{i=1}^{n}y_{n}c_{i}} , 其中
c i = ∑ j = 1 m a i j b j {\displaystyle c_{i}=\sum _{j=1}^{m}a_{ij}b_{j}} .
這顯然是一個線性運算元,其矩陣與使用的矩陣一致。這證實了每個 n×m 矩陣都可以確定一個線性運算元,該運算元將 m 維向量空間對映到 n 維向量空間。
定義 C=A+B,其中 A 和 B 是線性變換,為函式 C(x)=A(x)+B(x)。可以很容易地驗證這也是一個線性變換。您可以驗證給定兩個線性變換 A 和 B,則
A+B=B+A
(A+B)+C=C+(B+A)
A+0=A
A+(-A)=0
其中 0 是零運算元,-A 是函式 -A(x),可以很容易地驗證它是一個線性變換。
給定線性變換 a,定義函式 μ A {\displaystyle \mu A} ,其中 μ {\displaystyle \mu } 是域中的元素,為函式 ( μ L ) ( x ) = μ ( L ( x ) ) {\displaystyle (\mu L)(x)=\mu (L(x))} 。
可以很容易地驗證,給定線性變換 A 和 B 以及域中的元素 μ {\displaystyle \mu } , μ 1 {\displaystyle \mu _{1}} 和 μ 2 {\displaystyle \mu _{2}} ,則
μ 1 ( μ 2 A ) = ( μ 1 μ 2 ) A {\displaystyle \mu _{1}(\mu _{2}A)=(\mu _{1}\mu _{2})A}
1 A = A {\displaystyle 1A=A}
( μ 1 + μ 2 ) A = μ 1 A + μ 2 A {\displaystyle (\mu _{1}+\mu _{2})A=\mu _{1}A+\mu _{2}A}
μ ( A + B ) = μ A + μ B {\displaystyle \mu (A+B)=\mu A+\mu B}
這意味著線性變換形成一個向量空間。
給定從 X 到 Y 的線性變換 A 和從 Y 到 Z 的線性變換 B,然後定義從 X 到 Z 的函式 AB 為這兩個函式的複合。可以很容易地驗證這也是一個線性變換。
以下是一些可以很容易地驗證的有用關係
μ ( A B ) = ( μ A ) B {\displaystyle \mu (AB)=(\mu A)B}
( A + B ) C = A C + B C {\displaystyle (A+B)C=AC+BC}
C ( A + B ) = C A + C B {\displaystyle C(A+B)=CA+CB}
( A B ) C = A ( B C ) {\displaystyle (AB)C=A(BC)} .
由於從 m 維空間到 n 維空間的線性變換與 m×n 矩陣之間存在一一對應關係,因此加法、標量乘法和乘法運算在其一一對應關係中定義,並且上面列出的所有性質都適用於矩陣。矩陣 M 和 N 的加法可以定義為對應於 m+n 的矩陣,其中 m 和 n 分別對應於 M 和 N 的線性變換。其他操作類似地定義。
設 A = |aij | 和 B = |bij | 是兩個 n×m 維矩陣。考慮 **A** 和 **B**,它們是從 m 維向量空間 M 到 n 維向量空間 N 的對應線性變換。設 m1 ,m2 ,m3 ,…,mm 是 M 的基向量,n1 ,n2 ,n3 ,…,nn 是 N 的基向量。然後
A ( m i ) = ∑ j = 1 n a i j n j {\displaystyle A(m_{i})=\sum _{j=1}^{n}a_{ij}n_{j}} , 以及 B ( m i ) = ∑ j = 1 n b i j n j {\displaystyle B(m_{i})=\sum _{j=1}^{n}b_{ij}n_{j}} .
因此
( A + B ) ( m i ) = ∑ j = 1 n ( a i j + b i j ) n j {\displaystyle (A+B)(m_{i})=\sum _{j=1}^{n}(a_{ij}+b_{ij})n_{j}}
因此,該運算元的矩陣的元素為 |aij +bij |。換句話說,兩個矩陣的和的元素是這兩個矩陣對應元素的和。
示例
( 1 3 1 0 1 2 ) + ( 0 0 7 5 2 1 ) = ( 1 + 0 3 + 0 1 + 7 0 + 5 1 + 2 2 + 1 ) = ( 1 3 8 5 3 3 ) {\displaystyle {\begin{pmatrix}1&3\\1&0\\1&2\end{pmatrix}}+{\begin{pmatrix}0&0\\7&5\\2&1\end{pmatrix}}={\begin{pmatrix}1+0&3+0\\1+7&0+5\\1+2&2+1\end{pmatrix}}={\begin{pmatrix}1&3\\8&5\\3&3\end{pmatrix}}}
一旦定義了加法,我們就顯然也定義了減法。A - B 透過減去 A 和 B 的對應元素來計算,並且具有與 A 和 B 相同的維度。例如
( 1 3 1 0 1 2 ) − ( 0 0 7 5 2 1 ) = ( 1 − 0 3 − 0 1 − 7 0 − 5 1 − 2 2 − 1 ) = ( 1 3 − 6 − 5 − 1 1 ) {\displaystyle {\begin{pmatrix}1&3\\1&0\\1&2\end{pmatrix}}-{\begin{pmatrix}0&0\\7&5\\2&1\end{pmatrix}}={\begin{pmatrix}1-0&3-0\\1-7&0-5\\1-2&2-1\end{pmatrix}}={\begin{pmatrix}1&3\\-6&-5\\-1&1\end{pmatrix}}}
矩陣的標量乘法定義為對應線性變換的標量乘積的對應矩陣。
考慮一個元素為 |aij | 的矩陣 A 及其從 M 到 N 的對應線性變換A ,以及域中的一個元素 μ {\displaystyle \mu } ,並且設 m1 , m2 , m3 , ..., mm 為 M 的基向量,n1 , n2 , n3 , ..., nn 為 N 的基向量。由於
( μ A ) ( m j ) = ∑ i = 1 m μ a i j n i = μ ∑ i = 1 m a i j n i {\displaystyle (\mu A)(m_{j})=\sum _{i=1}^{m}\mu a_{ij}n_{i}=\mu \sum _{i=1}^{m}a_{ij}n_{i}} ,對應矩陣的元素為 | μ {\displaystyle \mu } aij |。
For example, multiplication by 2 of a matrix:
2 ⋅ ( 1 8 − 3 4 − 2 5 ) = ( 2 ⋅ 1 2 ⋅ 8 2 ⋅ − 3 2 ⋅ 4 2 ⋅ − 2 2 ⋅ 5 ) = ( 2 16 − 6 8 − 4 10 ) {\displaystyle 2\cdot {\begin{pmatrix}1&8&-3\\4&-2&5\end{pmatrix}}={\begin{pmatrix}2\cdot 1&2\cdot 8&2\cdot -3\\2\cdot 4&2\cdot -2&2\cdot 5\end{pmatrix}}={\begin{pmatrix}2&16&-6\\8&-4&10\end{pmatrix}}}
標量乘法具有以下性質,這些性質已經因其與線性變換的一一對應而得到證明
左分配律: (α+β)A = αA+βA。
右分配律: α(A+B) = αA+αB。
結合律: (αβ)A=α(βA)).
1A = A.
0A= 0 .
(-1)A = -A.
如上所述,矩陣乘法也將被定義為其與線性變換的對應關係。兩個矩陣的乘積是對應兩個線性變換的乘積的對應矩陣。
考慮一個 o 行 n 列的矩陣 A,其元素為 |aij |,一個 n 行 m 列的矩陣 B,其元素為 |bij |,並設 A 是從 n 維 M 到 o 維 O 的線性變換,它對應於 A,設 B 是從 m 維 N 到 n 維 N 的線性變換,它對應於 B,並設 m1 , m2 , m3 , ..., mm , 為 M 的基向量,n1 , n2 , n3 , ..., nn , 為 N 的基向量,o1 , o2 , o3 , ..., oo , 為 O 的基向量。那麼
( A B ) ( m i ) = A ( ∑ j = 1 n b j i n j ) = ∑ j = 1 n b j i A ( n j ) = ∑ j = 1 n b j i ∑ k = 1 o a k j o k = ∑ k = 1 o ( ∑ j = 1 n a k j b j i ) o k {\displaystyle (AB)(m_{i})=A(\sum _{j=1}^{n}b_{ji}n_{j})=\sum _{j=1}^{n}b_{ji}A(n_{j})=\sum _{j=1}^{n}b_{ji}\sum _{k=1}^{o}a_{kj}o_{k}=\sum _{k=1}^{o}(\sum _{j=1}^{n}a_{kj}b_{ji})o_{k}}
因此對應矩陣的元素 |pij | 由下式給出
p i j = ∑ k = 1 n a i k b k j {\displaystyle p_{ij}=\sum _{k=1}^{n}a_{ik}b_{kj}}
例如
( 1 0 2 − 1 3 1 ) × ( 3 1 2 1 1 0 ) = ( ( 1 × 3 + 0 × 2 + 2 × 1 ) ( 1 × 1 + 0 × 1 + 2 × 0 ) ( − 1 × 3 + 3 × 2 + 1 × 1 ) ( − 1 × 1 + 3 × 1 + 1 × 0 ) ) {\displaystyle {\begin{pmatrix}1&0&2\\-1&3&1\\\end{pmatrix}}\times {\begin{pmatrix}3&1\\2&1\\1&0\\\end{pmatrix}}={\begin{pmatrix}(1\times 3+0\times 2+2\times 1)&(1\times 1+0\times 1+2\times 0)\\(-1\times 3+3\times 2+1\times 1)&(-1\times 1+3\times 1+1\times 0)\\\end{pmatrix}}}
= ( 5 1 4 2 ) . {\displaystyle ={\begin{pmatrix}5&1\\4&2\\\end{pmatrix}}.}
矩陣乘積
矩陣乘法具有以下性質,這些性質已得到驗證,因為它們線上性變換中也是正確的。
結合律: A(BC) = (AB)C.
左分配律: A(B+C) = AB+AC.
右分配律: (A+B)C = AC+BC.
IA = A = AI.
α(BC) = (αB)C = B(αC).
矩陣乘法一般情況下不滿足交換律,即存在矩陣,使得 AB ≠ {\displaystyle \neq } BA。一個例子可以由: A = ( 7 8 9 10 11 12 ) {\displaystyle A={\begin{pmatrix}7&8\\9&10\\11&12\end{pmatrix}}} 和 B = ( 1 2 3 4 5 6 ) {\displaystyle B={\begin{pmatrix}1&2&3\\4&5&6\end{pmatrix}}} 給出。
矩陣乘法的定義方式似乎不合理且奇怪;為什麼矩陣乘法不能像加法和數乘那樣僅僅定義為對應元素相乘?不幸的是,我們只有在第三章才能找到問題的真正答案。在此之前,我們將透過注意到矩陣乘法在矩陣形式 下表示線性方程組所帶來的優勢來使自己滿意。這一點將在下一節中闡明。
在這一點上,我們認為有必要做出另一個定義。n 行 n 列的矩陣 A 為可逆 當且僅當存在矩陣 B 使得
AB = In = BA.
在這種情況下,B 是 A 的逆矩陣 ,用 A−1 表示。顯然,單位矩陣的逆矩陣就是它本身。我們將在後面詳細研究可逆矩陣。
這裡還需要注意一點。當乘積矩陣僅僅是透過將兩個相同維數矩陣的對應元素相乘得到的矩陣時,這種型別的矩陣乘法也有一個名稱。它被稱為哈達瑪積 。我們將不使用這種型別的乘法。在整本書中,矩陣乘法將始終指上面定義的矩陣乘積。
此外,行列式在以下意義上是乘法對映
det ( A B ) = det ( A ) det ( B ) {\displaystyle \det(AB)=\det(A)\det(B)\,} 對於所有n ×n 矩陣 A {\displaystyle A} 和 B {\displaystyle B} 。
這由柯西-比內公式 推廣到非方陣的乘積。
矩陣的概念在歷史上被引入是為了簡化線性方程組的求解,儘管它們今天有著更廣泛的應用。讓我們看看如何用矩陣來表示線性方程組。
考慮一個包含 m 個線性方程和 n 個未知數的一般方程組
a 11 x 1 + a 12 x 2 + ⋯ + a 1 n x n = b 1 a 21 x 1 + a 22 x 2 + ⋯ + a 2 n x n = b 2 ⋮ ⋮ ⋮ ⋮ a m 1 x 1 + a m 2 x 2 + ⋯ + a m n x n = b m {\displaystyle {\begin{alignedat}{7}a_{11}x_{1}&&\;+\;&&a_{12}x_{2}&&\;+\cdots +\;&&a_{1n}x_{n}&&\;=\;&&&b_{1}\\a_{21}x_{1}&&\;+\;&&a_{22}x_{2}&&\;+\cdots +\;&&a_{2n}x_{n}&&\;=\;&&&b_{2}\\\vdots \;\;\;&&&&\vdots \;\;\;&&&&\vdots \;\;\;&&&&&\;\vdots \\a_{m1}x_{1}&&\;+\;&&a_{m2}x_{2}&&\;+\cdots +\;&&a_{mn}x_{n}&&\;=\;&&&b_{m}\\\end{alignedat}}}
該方程組等價於以下形式的矩陣方程
A x = b {\displaystyle A\mathbf {x} =\mathbf {b} }
其中 A 是一個 m×n 矩陣,x 是一個包含 n 個元素的列矩陣,b 是一個包含 m 個元素的列矩陣。
A = [ a 11 a 12 ⋯ a 1 n a 21 a 22 ⋯ a 2 n ⋮ ⋮ ⋱ ⋮ a m 1 a m 2 ⋯ a m n ] , x = [ x 1 x 2 ⋮ x n ] , b = [ b 1 b 2 ⋮ b m ] {\displaystyle A={\begin{bmatrix}a_{11}&a_{12}&\cdots &a_{1n}\\a_{21}&a_{22}&\cdots &a_{2n}\\\vdots &\vdots &\ddots &\vdots \\a_{m1}&a_{m2}&\cdots &a_{mn}\end{bmatrix}},\quad \mathbf {x} ={\begin{bmatrix}x_{1}\\x_{2}\\\vdots \\x_{n}\end{bmatrix}},\quad \mathbf {b} ={\begin{bmatrix}b_{1}\\b_{2}\\\vdots \\b_{m}\end{bmatrix}}}
顯然,我們定義矩陣乘法的這種方式用於以這種方式表示線性方程組,因為現在矩陣 A 和矩陣 x 的乘積正好給了我們矩陣 b。
用這種方式表示線性方程組,也使我們能夠很容易地證明以下定理
定理 1: 任何線性方程組要麼無解,要麼只有一個解,要麼有無數個解。
證明: 假設線性方程組 Ax = b 有兩個不同的解,分別為 X 和 Y。然後設 Z = X - Y。顯然 Z 不為零,並且 A(X + kZ) = AX + kAZ = b + k(AX - AY) = b + k(b - b) = b,因此對於 k 的所有可能取值,X + kZ 都是該方程組的解。由於 k 可以取無數個值,因此顯然我們有無數個解。
許多練習的提示可以在著名數學定理/代數/矩陣理論 中找到。
1. 設 A 和 B 為 m×n 矩陣。那麼
(i) ( k A ) T {\displaystyle (kA)^{T}} = k A T {\displaystyle kA^{T}}
(ii) ( A + B ) T = A T + B T {\displaystyle (A+B)^{T}=A^{T}+B^{T}}
(iii) ( A B ) T = B T A T {\displaystyle (AB)^{T}=B^{T}A^{T}}
2. 設一個 _三角矩陣_ 是一個方陣,其中所有 (i,j) 元素要麼對於 i<j(在這種情況下稱為 _下三角矩陣_)要麼對於 j<i(在這種情況下稱為 _上三角矩陣_)為零。證明任何滿足 A A T = A T A {\displaystyle AA^{T}=A^{T}A} 的三角矩陣都是對角矩陣。
3. 對於一個方陣 A,證明
(i) A A T {\displaystyle AA^{T}} 和 A + A T {\displaystyle A+A^{T}} 是對稱的
(ii) A − A T {\displaystyle A-A^{T}} 是反對稱的
(iii) A 可以表示為一個對稱矩陣 1 2 ( A + A T ) {\displaystyle {\frac {1}{2}}(A+A^{T})} 和一個反對稱矩陣 1 2 ( A − A T ) {\displaystyle {\frac {1}{2}}(A-A^{T})} 的和。
4. 假設 A 是一個 m×n 矩陣,x 是一個 n×1 列向量。證明如果 x = ( x 1 x 2 ⋮ x n ) {\displaystyle x={\begin{pmatrix}x_{1}\\x_{2}\\\vdots \\x_{n}\end{pmatrix}}} 且 A = ( c 1 c 2 ⋯ c n ) {\displaystyle A={\begin{pmatrix}c_{1}&c_{2}&\cdots c_{n}\end{pmatrix}}} ,其中 c j = ( A 1 j A 2 j ⋮ A m j ) {\displaystyle c_{j}={\begin{pmatrix}A_{1j}\\A_{2j}\\\vdots \\A_{mj}\end{pmatrix}}} ,那麼 A x = x 1 c 1 + x 2 c 2 + ⋯ x n c n {\displaystyle Ax=x_{1}c_{1}+x_{2}c_{2}+\cdots x_{n}c_{n}} 。這也表示為 Ax 是 _A 的列的線性組合_。