线性代数——特征值和特征向量

编程入门行业动态更新时间:2024-10-22 17:31:35

线性代数——<a href=https://www.elefans.com/category/jswz/34/1698647.html style= 特征值和特征向量"/>

线性代数——特征值和特征向量

系列文章目录

学习高等数学和线性代数需要的初等数学知识
线性代数——行列式
线性代数——矩阵
线性代数——向量
线性代数——线性方程组
线性代数——特征值和特征向量
线性代数——二次型

文章目录

系列文章目录
版权声明
向量内积
正交矩阵
特征值和特征向量
相似矩阵
相似对角化
实对称矩阵

版权声明

本文大部分内容皆来自李永乐老师考研教材和视频课。

向量内积

设 α = ( a 1 , a 2 , … , a n ) T , β = ( b 1 , b 2 , … , b n ) T \alpha=(a_1,a_2,\dots,a_n)^T,\beta=(b_1,b_2,\dots,b_n)^T α=(a1,a2,…,an)T,β=(b1,b2,…,bn)T，令
( α , β ) = a 1 b 1 + a 2 b 2 , + ⋯ + a n b n (\alpha,\beta)=a_1b_1+a_2b_2,+\dots+a_nb_n (α,β)=a1b1+a2b2,+⋯+anbn
则称其为向量 α \alpha α和 β \beta β的内积。如果 ( α , β ) = 0 (\alpha,\beta)=0 (α,β)=0，则称 α \alpha α与 β \beta β正交，记作
A ⊥ B A\perp B A⊥B
向量 α \alpha α的长度为 ( α , α ) \sqrt{(\alpha,\alpha)} (α,α) ，记作
∣ ∣ α ∣ ∣ = ( α , α ) = a 1 2 + a 2 2 + ⋯ + a n 2 ||\alpha||=\sqrt{(\alpha,\alpha)}=\sqrt{a_1^2+a_2^2+\dots+a_n^2} ∣∣α∣∣=(α,α) =a12+a22+⋯+an2
长度为 1 1 1的向量称为单位向量。内积的性质如下：

( α , β ) = ( β , α ) (\alpha,\beta)=(\beta,\alpha) (α,β)=(β,α)
( α + β , γ ) = ( α , γ ) + ( β , γ ) (\alpha+\beta,\gamma)=(\alpha,\gamma)+(\beta,\gamma) (α+β,γ)=(α,γ)+(β,γ)
( k α , β ) = k ( α , β ) (k\alpha,\beta)=k(\alpha,\beta) (kα,β)=k(α,β)
( α , α ) = 0 ⇔ α = O (\alpha,\alpha)=0\Leftrightarrow\alpha=O (α,α)=0⇔α=O
柯西-施瓦茨不等式： ( α , β ) 2 ≤ ∣ ∣ α ∣ ∣ 2 ∣ ∣ β ∣ ∣ 2 (\alpha,\beta)^2\leq||\alpha||^2||\beta||^2 (α,β)2≤∣∣α∣∣2∣∣β∣∣2，当且仅当 α \alpha α和 β \beta β线性相关时等号成立。
证明：若 α , β \alpha,\beta α,β线性无关，则 ∀ \forall ∀实数 x x x有：
x α + β ≠ O ⇓ ( x α + β , x α + β ) = ( α , α ) x 2 + 2 ( α , β ) x + ( β , β ) > 0 x\alpha+\beta\neq O\\ \Downarrow\\ (x\alpha+\beta,x\alpha+\beta)=(\alpha,\alpha)x^2+2(\alpha,\beta)x+(\beta,\beta)>0 xα+β=O⇓(xα+β,xα+β)=(α,α)x2+2(α,β)x+(β,β)>0
作为 x x x的二次函数， ∀ x \forall x ∀x其函数值恒大于 0 0 0，所以：
[ 2 ( α , β ) ] 2 − 4 ( α , α ) ( β , β ) < 0 ⇓ ( α , β ) 2 < ∣ ∣ α ∣ ∣ 2 ∣ ∣ β ∣ ∣ 2 [2(\alpha,\beta)]^2-4(\alpha,\alpha)(\beta,\beta)<0\\ \Downarrow\\ (\alpha,\beta)^2<||\alpha||^2||\beta||^2 [2(α,β)]2−4(α,α)(β,β)<0⇓(α,β)2<∣∣α∣∣2∣∣β∣∣2
若 α , β \alpha,\beta α,β线性相关，当 α = O \alpha=O α=O或 β = O \beta=O β=O时：
( α , β ) 2 = ∣ ∣ α ∣ ∣ 2 ∣ ∣ β ∣ ∣ 2 = 0 (\alpha,\beta)^2=||\alpha||^2||\beta||^2=0 (α,β)2=∣∣α∣∣2∣∣β∣∣2=0
当 β = k α ≠ O \beta=k\alpha\neq O β=kα=O时：
( α , β ) 2 = ( α , k α ) 2 = k 2 ( α , α ) 2 = ( α , α ) ( k α , k α ) = ∣ ∣ α ∣ ∣ 2 ∣ ∣ β ∣ ∣ 2 (\alpha,\beta)^2=(\alpha,k\alpha)^2=k^2(\alpha,\alpha)^2=(\alpha,\alpha)(k\alpha,k\alpha)=||\alpha||^2||\beta||^2 (α,β)2=(α,kα)2=k2(α,α)2=(α,α)(kα,kα)=∣∣α∣∣2∣∣β∣∣2
若 n n n维向量组 α 1 , α 2 , … , α r \alpha_1,\alpha_2,\dots,\alpha_r α1,α2,…,αr是一组两两正交的非零向量，则 α 1 , α 2 , … , α r \alpha_1,\alpha_2,\dots,\alpha_r α1,α2,…,αr线性无关。
证明：设
k 1 α 1 + k 2 α 2 + ⋯ + k r α r = O ① \tag*{①}k_1\alpha_1+k_2\alpha_2+\dots+k_r\alpha_r=O k1α1+k2α2+⋯+krαr=O①
则必有 k 1 = 0 , k 2 = 0 , … , k r = 0 k_1=0,k_2=0,\dots,k_r=0 k1=0,k2=0,…,kr=0，用 α 1 \alpha_1 α1对①两边做内积得：
( α 1 , k 1 α 1 + k 2 α 2 + ⋯ + k r α r ) = ( α 1 , O ) ⇓ k 1 ( α 1 , α 1 ) + k 2 ( α 1 , α 2 ) + ⋯ + k r ( α 1 , α r ) = 0 ⇓ k 1 ( α 1 , α 1 ) = 0 (\alpha_1,k_1\alpha_1+k_2\alpha_2+\dots+k_r\alpha_r)=(\alpha_1,O)\\ \Downarrow\\ k_1(\alpha_1,\alpha_1)+k_2(\alpha_1,\alpha_2)+\dots+k_r(\alpha_1,\alpha_r)=0\\ \Downarrow\\ k_1(\alpha_1,\alpha_1)=0 (α1,k1α1+k2α2+⋯+krαr)=(α1,O)⇓k1(α1,α1)+k2(α1,α2)+⋯+kr(α1,αr)=0⇓k1(α1,α1)=0
因 α 1 ≠ 0 , ( α 1 , α 1 ) > 0 \alpha_1\neq0,(\alpha_1,\alpha_1)>0 α1=0,(α1,α1)>0，所以必有 k 1 = 0 k_1=0 k1=0，同理可证 k 2 = 0 , … , k r = 0 k_2=0,\dots,k_r=0 k2=0,…,kr=0。
Schmidt正交化：设 α 1 , α 2 , α 3 \alpha_1,\alpha_2,\alpha_3 α1,α2,α3线性无关，令
β 1 = α 1 β 2 = α 2 − ( α 2 , β 1 ) ( β 1 , β 1 ) β 1 β 3 = α 3 − ( α 3 , β 1 ) ( β 1 , β 1 ) β 1 − ( α 3 , β 2 ) ( β 2 , β 2 ) β 2 \beta_1=\alpha_1\\ \beta_2=\alpha_2-\frac{(\alpha_2,\beta_1)}{(\beta_1,\beta_1)}\beta_1\\ \beta_3=\alpha_3-\frac{(\alpha_3,\beta_1)}{(\beta_1,\beta_1)}\beta_1-\frac{(\alpha_3,\beta_2)}{(\beta_2,\beta_2)}\beta_2 β1=α1β2=α2−(β1,β1)(α2,β1)β1β3=α3−(β1,β1)(α3,β1)β1−(β2,β2)(α3,β2)β2
那么 β 1 , β 2 , β 3 \beta_1,\beta_2,\beta_3 β1,β2,β3两两正交，将其单位化有：
γ 1 = β 1 ∣ ∣ β 1 ∣ ∣ , γ 2 = β 2 ∣ ∣ β 2 ∣ ∣ , γ 3 = β 3 ∣ ∣ β 3 ∣ ∣ \gamma_1=\frac{\beta_1}{||\beta_1||},\gamma_2=\frac{\beta_2}{||\beta_2||},\gamma_3=\frac{\beta_3}{||\beta_3||} γ1=∣∣β1∣∣β1,γ2=∣∣β2∣∣β2,γ3=∣∣β3∣∣β3
则 α 1 , α 2 , α 3 \alpha_1,\alpha_2,\alpha_3 α1,α2,α3到 γ 1 , γ 2 , γ 3 \gamma_1,\gamma_2,\gamma_3 γ1,γ2,γ3这一过程称为Schmidt正交化。

正交矩阵

设 A A A是 n n n阶矩阵，满足
A A T = A T A = E AA^T=A^TA=E AAT=ATA=E
则称 A A A为正交矩阵。正交矩阵的性质如下：

A A A是正交矩阵 ⇔ A T = A − 1 \Leftrightarrow A^T=A^{-1} ⇔AT=A−1
A = [ α 1 , α 2 , α 3 ] A=[\alpha_1,\alpha_2,\alpha_3] A=[α1,α2,α3]是正交矩阵 ⇔ α 1 , α 2 , α 3 \Leftrightarrow \alpha_1,\alpha_2,\alpha_3 ⇔α1,α2,α3都是单位向量，且两两正交。
证明:
A T A = [ α 1 T α 2 T α 3 T ] [ α 1 α 2 α 3 ] = [ α 1 T α 1 α 1 T α 2 α 1 T α 3 α 2 T α 1 α 2 T α 2 α 2 T α 3 α 3 T α 1 α 3 T α 2 α 3 T α 3 ] = [ 1 0 0 0 1 0 0 0 1 ] A^TA= \begin{bmatrix} \alpha_1^T\\ \alpha_2^T\\ \alpha_3^T\\ \end{bmatrix} \begin{bmatrix} \alpha_1&\alpha_2&\alpha_3 \end{bmatrix} = \begin{bmatrix} \alpha_1^T\alpha_1&\alpha_1^T\alpha_2&\alpha_1^T\alpha_3\\\ \alpha_2^T\alpha_1&\alpha_2^T\alpha_2&\alpha_2^T\alpha_3\\ \alpha_3^T\alpha_1&\alpha_3^T\alpha_2&\alpha_3^T\alpha_3\\ \end{bmatrix} =\begin{bmatrix} 1&0&0\\ 0&1&0\\ 0&0&1 \end{bmatrix}\\ ATA= α1Tα2Tα3T [α1α2α3]= α1Tα1 α2Tα1α3Tα1α1Tα2α2Tα2α3Tα2α1Tα3α2Tα3α3Tα3 = 100010001
如果 A A A是正交矩阵，则 ∣ A ∣ = 1 |A|=1 ∣A∣=1或 − 1 -1 −1。
证明：
A A T = E ∣ A A T ∣ = ∣ E ∣ ∣ A ∣ ∣ A T ∣ = 1 ∣ A ∣ 2 = 1 AA^T=E\\ |AA^T|=|E|\\ |A||A^T|=1\\ |A|^2=1 AAT=E∣AAT∣=∣E∣∣A∣∣AT∣=1∣A∣2=1
若 A , B A,B A,B都是正交矩阵，则 A B AB AB也是正交矩阵。
证明：
( A B ) ( A B ) T = A B B T A T = A E A T = E (AB)(AB)^T=ABB^TA^T=AEA^T=E\\ (AB)(AB)T=ABBTAT=AEAT=E

特征值和特征向量

设 A = [ a i j ] A=[a_{ij}] A=[aij]为一个 n n n阶矩阵，如果存在一个数 λ \lambda λ及非零的 n n n维列向量 α \alpha α，使得
A α = λ α ① \tag*{①} A\alpha=\lambda\alpha Aα=λα①
成立，则称 λ \lambda λ是矩阵 A A A的一个特征值，称 α \alpha α是矩阵 A A A属于特征值 λ \lambda λ的一个特征向量。由①可知
( λ E − A ) α = O , α ≠ O (\lambda E-A)\alpha=O,\alpha\neq O (λE−A)α=O,α=O
即 α \alpha α是齐次线性方程组
( λ E − A ) x = O ② \tag*{②}(\lambda E-A)x=O (λE−A)x=O②

的解，由克拉默法则可知， n n n个未知数、 n n n个方程的齐次线性方程组有非零解，则系数行列式
∣ λ E − A ∣ = ∣ λ − a 11 − a 12 … − a 1 n − a 21 λ − a 22 … − a 2 n ⋮ ⋮ ⋮ − a n 1 − a n 2 … λ − a n n ∣ = 0 |\lambda E-A|= \begin{vmatrix} \lambda-a_{11}&-a_{12}&\dots&-a_{1n}\\ -a_{21}&\lambda-a_{22}&\dots&-a_{2n}\\ \vdots&\vdots&&\vdots\\ -a_{n1}&-a_{n2}&\dots&\lambda-a_{nn} \end{vmatrix} =0 ∣λE−A∣= λ−a11−a21⋮−an1−a12λ−a22⋮−an2………−a1n−a2n⋮λ−ann =0
称 ∣ λ E − A ∣ |\lambda E-A| ∣λE−A∣为 A A A的特征多项式， ∣ λ E − A ∣ = 0 |\lambda E-A|=0 ∣λE−A∣=0为 A A A的特征方程。那么求方阵 A A A特征向量的步骤如下：

先由特征方程求出 A A A的特征值 λ i \lambda_i λi，共 n n n个（含重根）。
再由②求其通解，即矩阵 A A A属于特征值 λ i \lambda_i λi的线性无关的特征向量。

特征值和特征向量的性质如下：

( A + k E ) α = ( λ + k ) α (A+kE)\alpha=(\lambda+k)\alpha (A+kE)α=(λ+k)α
f ( A ) α = f ( λ ) α f(A)\alpha=f(\lambda)\alpha f(A)α=f(λ)α
A n α = λ n α A^n\alpha=\lambda^n\alpha Anα=λnα
A − 1 α = 1 λ α A^{-1}\alpha=\frac{1}{\lambda}\alpha A−1α=λ1α
A ∗ α = ∣ A ∣ λ α A^*\alpha=\frac{|A|}{\lambda}\alpha A∗α=λ∣A∣α
证明：由 A α 1 = λ α 1 , A α 2 = λ α 2 A\alpha_1=\lambda\alpha_1,A\alpha_2=\lambda\alpha_2 Aα1=λα1,Aα2=λα2得：
A ( k 1 α 1 + k 2 α 2 ) = k 1 A α 1 + k 2 A α 2 = k 1 ( λ α 1 ) + k 2 ( λ α 2 ) = λ ( k 1 α 1 + k 2 α 2 2 ) A(k_1\alpha_1+k_2\alpha_2)=k_1A\alpha_1+k_2A\alpha_2=k_1(\lambda\alpha_1)+k_2(\lambda\alpha_2)=\lambda(k_1\alpha_1+k_2\alpha_22) A(k1α1+k2α2)=k1Aα1+k2Aα2=k1(λα1)+k2(λα2)=λ(k1α1+k2α22)
设 A A A是 n n n阶矩阵， λ 1 , λ 2 , … , λ n \lambda_1,\lambda_2,\dots,\lambda_n λ1,λ2,…,λn是矩阵 A A A的特征值，则：
∑ λ i = ∑ a i i , ∏ λ i = ∣ A ∣ \sum\lambda_i=\sum a_{ii},\prod\lambda_i=|A| ∑λi=∑aii,∏λi=∣A∣
证明：设三阶矩阵 A A A，则有
∣ λ E − A ∣ = ∣ λ − a 11 − a 12 − a 13 − a 21 λ − a 22 − a 23 − a 31 − a 32 λ − a 33 ∣ = ∣ λ − a 12 − a 13 0 λ − a 22 − a 23 0 − a 32 λ − a 33 ∣ + ∣ − a 11 − a 12 − a 13 − a 21 λ − a 22 − a 23 − a 31 − a 32 λ − a 33 ∣ = ∣ λ 0 − a 13 0 λ − a 23 0 0 λ − a 33 ∣ + ∣ λ − a 12 − a 13 0 − a 22 − a 23 0 − a 32 λ − a 33 ∣ + ∣ − a 11 0 − a 13 − a 21 λ − a 23 − a 31 0 λ − a 33 ∣ + ∣ − a 11 − a 12 − a 13 − a 21 − a 22 − a 23 − a 31 − a 32 λ − a 33 ∣ … = λ 3 − ( a 11 + a 22 + a 33 ) λ 2 + S λ − ∣ A ∣ |\lambda E-A|= \begin{vmatrix} \lambda-a_{11}&-a_{12}&-a_{13}\\ -a_{21}&\lambda-a_{22}&-a_{23}\\ -a_{31}&-a_{32}&\lambda-a_{33} \end{vmatrix}\\ = \begin{vmatrix} \lambda&-a_{12}&-a_{13}\\ 0&\lambda-a_{22}&-a_{23}\\ 0&-a_{32}&\lambda-a_{33} \end{vmatrix} {+} \begin{vmatrix} -a_{11}&-a_{12}&-a_{13}\\ -a_{21}&\lambda-a_{22}&-a_{23}\\ -a_{31}&-a_{32}&\lambda-a_{33} \end{vmatrix}\\ = \begin{vmatrix} \lambda&0&-a_{13}\\ 0&\lambda&-a_{23}\\ 0&0&\lambda-a_{33} \end{vmatrix} {+} \begin{vmatrix} \lambda&-a_{12}&-a_{13}\\ 0&-a_{22}&-a_{23}\\ 0&-a_{32}&\lambda-a_{33} \end{vmatrix} {+} \begin{vmatrix} -a_{11}&0&-a_{13}\\ -a_{21}&\lambda&-a_{23}\\ -a_{31}&0&\lambda-a_{33} \end{vmatrix} {+} \begin{vmatrix} -a_{11}&-a_{12}&-a_{13}\\ -a_{21}&-a_{22}&-a_{23}\\ -a_{31}&-a_{32}&\lambda-a_{33} \end{vmatrix}\\ \dots\\ =\lambda^3-(a_{11}+a_{22}+a_{33})\lambda^2+S\lambda-|A| ∣λE−A∣= λ−a11−a21−a31−a12λ−a22−a32−a13−a23λ−a33 = λ00−a12λ−a22−a32−a13−a23λ−a33 + −a11−a21−a31−a12λ−a22−a32−a13−a23λ−a33 = λ000λ0−a13−a23λ−a33 + λ00−a12−a22−a32−a13−a23λ−a33 + −a11−a21−a310λ0−a13−a23λ−a33 + −a11−a21−a31−a12−a22−a32−a13−a23λ−a33 …=λ3−(a11+a22+a33)λ2+Sλ−∣A∣
设特征方程的解为 λ 1 , λ 2 , λ 3 \lambda_1,\lambda_2,\lambda_3 λ1,λ2,λ3，那么
λ 3 − ( a 11 + a 22 + a 33 ) λ 2 + S λ − ∣ A ∣ = ( λ − λ 1 ) ( λ − λ 2 ) ( λ − λ 3 ) = λ 3 − ( λ 1 + λ 2 + λ 3 ) λ 2 + S λ − λ 1 λ 2 λ 3 \lambda^3-(a_{11}+a_{22}+a_{33})\lambda^2+S\lambda-|A|= (\lambda-\lambda_1)(\lambda-\lambda_2)(\lambda-\lambda_3)=\lambda^3-(\lambda_1+\lambda_2+\lambda_3)\lambda^2+S\lambda-\lambda_1\lambda_2\lambda_3 λ3−(a11+a22+a33)λ2+Sλ−∣A∣=(λ−λ1)(λ−λ2)(λ−λ3)=λ3−(λ1+λ2+λ3)λ2+Sλ−λ1λ2λ3
所以
∑ λ i = ∑ a i i , ∏ λ i = ∣ A ∣ \sum\lambda_i=\sum a_{ii},\prod\lambda_i=|A| ∑λi=∑aii,∏λi=∣A∣
其中 S S S为一次项的系数，不重要。
如果 A = ( a i j ) A=(a_{ij}) A=(aij)是 3 3 3阶矩阵，则 A A A的特征多项式 ∣ λ E − A ∣ = λ 3 − ( a 11 + a 22 + a 33 ) λ 2 + s 2 λ − ∣ A ∣ \begin{vmatrix}\lambda E-A \end{vmatrix}=\lambda^{3}-(a_{11}+a_{22}+a_{33})\lambda^2+s_2\lambda-|A| λE−A =λ3−(a11+a22+a33)λ2+s2λ−∣A∣其中 s 2 = ∣ a 11 a 12 a 21 a 22 ∣ + ∣ a 11 a 13 a 31 a 33 ∣ + ∣ a 11 a 22 a 32 a 33 ∣ s_2=\begin{vmatrix}a_{11}&a_{12}\\a_{21}&a_{22}\end{vmatrix}+\begin{vmatrix}a_{11}&a_{13}\\a_{31}&a_{33}\end{vmatrix}+\begin{vmatrix}a_{11}&a_{22}\\a_{32}&a_{33}\end{vmatrix} s2= a11a21a12a22 + a11a31a13a33 + a11a32a22a33
如果 A = ( a i j ) A=(a_{ij}) A=(aij)是 n n n阶矩阵，且 r ( A ) = 1 r(A)=1 r(A)=1，则 ∣ λ E − A ∣ = λ n − ∑ a i i λ n − 1 |\lambda E-A|=\lambda^n-\sum a_{ii}\lambda^{n-1} ∣λE−A∣=λn−∑aiiλn−1
如果 α 1 , α 2 … , α t \alpha_1,\alpha_2\dots,\alpha_t α1,α2…,αt都是属于矩阵 A A A的特征值 λ \lambda λ的特征向量，那么当 k 1 α 1 + k 2 α 2 + ⋯ + k t α t k_1\alpha_1+k_2\alpha_2+\dots+k_t\alpha_t k1α1+k2α2+⋯+ktαt非零时， k 1 α 1 + k 2 α 2 + ⋯ + k t α t k_1\alpha_1+k_2\alpha_2+\dots+k_t\alpha_t k1α1+k2α2+⋯+ktαt仍然是属于矩阵 A A A的特征值 λ \lambda λ的特征向量。
如果 λ 1 , λ 2 , … , λ m \lambda_1,\lambda_2,\dots,\lambda_m λ1,λ2,…,λm是矩阵 A A A的互不相同的特征值， α 1 , α 2 … , α m \alpha_1,\alpha_2\dots,\alpha_m α1,α2…,αm分别是与之对应的特征向量，则 α 1 , α 2 … , α m \alpha_1,\alpha_2\dots,\alpha_m α1,α2…,αm线性无关。
证明：对特征值的个数 m m m做数学归纳法，当 m = 1 m=1 m=1时， α 1 ≠ O \alpha_1\neq O α1=O，命题正确。设 m = k − 1 m=k-1 m=k−1时命题正确，当 m = k m=k m=k时，设
x 1 α 1 + x 2 α 2 + ⋯ + x k − 1 α k − 1 + x k α k = O ① \tag*{①}x_1\alpha_1+x_2\alpha_2+\dots+x_{k-1}\alpha_{k-1}+x_k\alpha_k=O x1α1+x2α2+⋯+xk−1αk−1+xkαk=O①
用 A A A左乘上式有
x 1 λ 1 α 1 + x 2 λ 2 α 2 + ⋯ + x k − 1 λ k − 1 α k − 1 + x k λ k α k = O ② \tag*{②}x_1\lambda_1\alpha_1+x_2\lambda_2\alpha_2+\dots+x_{k-1}\lambda_{k-1}\alpha_{k-1}+x_k\lambda_k\alpha_k=O x1λ1α1+x2λ2α2+⋯+xk−1λk−1αk−1+xkλkαk=O②
用 λ k \lambda_k λk乘①得
x 1 λ k α 1 + x 2 λ k α 2 + ⋯ + x k − 1 λ k α k − 1 + x k λ k α k = O ③ \tag*{③}x_1\lambda_k\alpha_1+x_2\lambda_k\alpha_2+\dots+x_{k-1}\lambda_{k}\alpha_{k-1}+x_k\lambda_k\alpha_k=O x1λkα1+x2λkα2+⋯+xk−1λkαk−1+xkλkαk=O③
② − - −③得
x 1 ( λ 1 − λ k ) α 1 + x 2 ( λ 2 − λ k ) α 2 + ⋯ + x k − 1 ( λ k − 1 − λ k ) α k − 1 = O x_1(\lambda_1-\lambda_k)\alpha_1+x_2(\lambda_2-\lambda_k)\alpha_2+\dots+x_{k-1}(\lambda_{k-1}-\lambda_k)\alpha_{k-1}=O x1(λ1−λk)α1+x2(λ2−λk)α2+⋯+xk−1(λk−1−λk)αk−1=O
又因为 λ i ≠ λ j \lambda_i\neq\lambda_j λi=λj且 m = k − 1 m=k-1 m=k−1时命题成立，所以
x 1 = 0 , x 2 = 0 , … , x k − 1 = 0 x_1=0,x_2=0,\dots,x_{k-1}=0 x1=0,x2=0,…,xk−1=0
代入①得
x k α k = O x_k\alpha_k=O xkαk=O
所以 x k = 0 x_k=0 xk=0，即使 x 1 = 0 , x 2 = 0 , … , x k = 0 x_1=0,x_2=0,\dots,x_{k}=0 x1=0,x2=0,…,xk=0，因此 α 1 , α 2 … , α m \alpha_1,\alpha_2\dots,\alpha_m α1,α2…,αm线性无关。
如果 A A A是 n n n阶矩阵， λ \lambda λ是 A A A的 m m m重特征值，则属于 λ \lambda λ的线性无关的特征向量最多有 m m m个。

相似矩阵

设 A , B A,B A,B都是 n n n阶矩阵，如果存在可逆矩阵 P P P，使得
P − 1 A P = B P^{-1}AP=B P−1AP=B
则称矩阵 A A A和 B B B相似，记作 A ∼ B A\thicksim B A∼B
相似矩阵的性质如下：

A ∼ A A\thicksim A A∼A
A ∼ B ⇔ B ∼ A A\thicksim B\Leftrightarrow B\thicksim A A∼B⇔B∼A
A ∼ B , B ∼ A ⇒ A ∼ C A\thicksim B,B\thicksim A\Rightarrow A\thicksim C A∼B,B∼A⇒A∼C
证明：设 P 1 − 1 A P 1 = B , P 2 − 1 B P 2 = C P_1^{-1}AP_1=B,P_2^{-1}BP_2=C P1−1AP1=B,P2−1BP2=C则
P 2 − 1 ( P 1 − 1 A P 1 ) P 2 = C P_2^{-1}(P_1^{-1}AP_1)P_2=C P2−1(P1−1AP1)P2=C
令 P = P 1 P 2 P=P_1P_2 P=P1P2，有 P − 1 = ( P 1 P 2 ) − 1 = P 2 − 1 P 1 − 1 P^{-1}=(P_1P_2)^{-1}=P_2^{-1}P_1^{-1} P−1=(P1P2)−1=P2−1P1−1，所以 P − 1 A P = C P^{-1}AP=C P−1AP=C。
A 1 ∼ B 1 , A 2 ∼ B 2 ⇒ [ A 1 A 2 ] ∼ [ B 1 B 2 ] A_1\thicksim B_1,A_2\thicksim B_2 \Rightarrow\begin{bmatrix}A_1&\\&A_2\end{bmatrix}\thicksim\begin{bmatrix}B_1&\\&B_2\end{bmatrix} A1∼B1,A2∼B2⇒[A1A2]∼[B1B2]
A ∼ B A\thicksim B A∼B
⇒ A n ∼ B n \Rightarrow A^n\thicksim B^n ⇒An∼Bn
⇒ ( A + k E ) n ∼ ( B + k E ) n \Rightarrow (A+kE)^n\thicksim (B+kE)^n ⇒(A+kE)n∼(B+kE)n
⇒ A T ∼ B T \Rightarrow A^T\thicksim B^T ⇒AT∼BT
⇒ \Rightarrow ⇒如果 A A A可逆，则 A − 1 ∼ B − 1 A^{-1}\thicksim B^{-1} A−1∼B−1
⇒ r ( A ) = r ( B ) \Rightarrow r(A)=r(B) ⇒r(A)=r(B)
⇒ ∣ A ∣ = ∣ B ∣ \Rightarrow |A|=|B| ⇒∣A∣=∣B∣
⇒ ∣ λ E − A ∣ = ∣ λ E − B ∣ \Rightarrow |\lambda E-A|=|\lambda E-B| ⇒∣λE−A∣=∣λE−B∣
⇒ λ A = λ B \Rightarrow \lambda_A=\lambda_B ⇒λA=λB
⇒ A \Rightarrow A ⇒A对应于 λ \lambda λ的特征向量为 α \alpha α，则 B B B对应于 λ \lambda λ的特征向量为 P − 1 A P^{-1}A P−1A
⇒ B \Rightarrow B ⇒B对应于 λ \lambda λ的特征向量为 α \alpha α，则 A A A对应于 λ \lambda λ的特征向量为 P A PA PA

判断两个矩阵相似的方法如下：

特征值是否相等
如果某个矩阵是实对称矩阵，则判断另一个矩阵是否可相似对角化
判断特征值特征向量的个数

相似对角化

如果 A A A能与对角矩阵相似，则称 A A A可对角化。
P − 1 A P = Λ A P = P Λ P^{-1}AP=\Lambda\\ AP=P\Lambda P−1AP=ΛAP=PΛ
假设 A A A是三阶矩阵，对 P P P按列分块：
A [ p 1 , p 2 , p 3 ] = [ p 1 , p 2 , p 3 ] [ λ 1 λ 2 λ 3 ] ⇓ [ A p 1 , A p 2 , A p 3 ] = [ λ 1 p 1 , λ 2 p 2 , λ 3 p 3 ] ⇓ A p 1 = λ 1 p 1 , A p 2 = λ 2 p 2 , A p 3 = λ 3 p 3 A[p_1,p_2,p_3]=[p_1,p_2,p_3] \begin{bmatrix} \lambda_1&&\\ &\lambda_2&\\ &&\lambda_3\\ \end{bmatrix}\\ \Downarrow\\ [Ap_1,Ap_2,Ap_3]=[\lambda_1p_1,\lambda_2p_2,\lambda_3p_3]\\ \Downarrow\\ Ap_1=\lambda_1p_1,Ap_2=\lambda_2p_2,Ap_3=\lambda_3p_3 A[p1,p2,p3]=[p1,p2,p3] λ1λ2λ3 ⇓[Ap1,Ap2,Ap3]=[λ1p1,λ2p2,λ3p3]⇓Ap1=λ1p1,Ap2=λ2p2,Ap3=λ3p3
那么：

A A A的特征值： λ 1 , λ 2 , λ 3 \lambda_1,\lambda_2,\lambda_3 λ1,λ2,λ3
A A A的特征向量： p 1 , p 2 , p 3 p_1,p_2,p_3 p1,p2,p3

反之，若 A A A有 3 3 3个无关的特征向量 p 1 , p 2 , p 3 p_1,p_2,p_3 p1,p2,p3，满足 A p i = λ i p i ( i = 1 , 2 , 3 ) Ap_i=\lambda_ip_i(i=1,2,3) Api=λipi(i=1,2,3)，则有
A [ p 1 , p 2 , p 3 ] = [ p 1 , p 2 , p 3 ] [ λ 1 λ 2 λ 3 ] A[p_1,p_2,p_3]=[p_1,p_2,p_3] \begin{bmatrix} \lambda_1&&\\ &\lambda_2&\\ &&\lambda_3\\ \end{bmatrix} A[p1,p2,p3]=[p1,p2,p3] λ1λ2λ3
令 P = [ p 1 , p 2 , p 3 ] , Λ = [ λ 1 λ 2 λ 3 ] P=[p_1,p_2,p_3],\Lambda=\begin{bmatrix}\lambda_1&&\\&\lambda_2&\\&&\lambda_3\\\end{bmatrix} P=[p1,p2,p3],Λ= λ1λ2λ3 ，则
P − 1 A P = Λ P^{-1}AP=\Lambda P−1AP=Λ
矩阵对角化的性质如下：

n n n阶矩阵 A A A可对角化
⇔ A \Leftrightarrow A ⇔A有 n n n个线性无关的特征向量
⇔ \Leftrightarrow ⇔ λ i \lambda_i λi是 A A A的 n i n_i ni重特征值，则 λ i \lambda_i λi有 n i n_i ni个线性无关的特征向量
⇔ \Leftrightarrow ⇔秩 r ( λ E − A ) = n − n i r(\lambda E-A)=n-n_i r(λE−A)=n−ni， λ i \lambda_i λi为 n i n_i ni重特征值。
如果 A A A有 n n n个不同的特征值 λ 1 , λ 2 , … , λ n \lambda_1,\lambda_2,\dots,\lambda_n λ1,λ2,…,λn，则 A A A可相似对角化，且
A ∼ [ λ 1 λ 2 ⋱ λ n ] A\thicksim \begin{bmatrix} \lambda_1&&&\\ &\lambda_2&&\\ &&\ddots&\\ &&&\lambda_n\\ \end{bmatrix} A∼ λ1λ2⋱λn
A 2 = A ⇒ A ∼ Λ A^2=A\Rightarrow A\thicksim\Lambda A2=A⇒A∼Λ
A 2 = E ⇒ A ∼ Λ A^2=E\Rightarrow A\thicksim\Lambda A2=E⇒A∼Λ
r ( A ) = 1 r(A)=1 r(A)=1且 t r ( A ) ≠ 0 ⇒ A ∼ Λ tr(A)\neq0\Rightarrow A\thicksim\Lambda tr(A)=0⇒A∼Λ

实对称矩阵

满足以下两个条件的方阵称为实对称矩阵：

A = A T A=A^T A=AT
矩阵的元素全为实数。

实对称矩阵的性质如下：

若矩阵 A A A是实对称矩阵，则 A A A的特征值都是实数。
证明：设 A α = λ α A\alpha=\lambda \alpha Aα=λα，则
A α ˉ = λ α ˉ A ˉ α ˉ = λ ˉ α ˉ \bar{A\alpha}=\bar{\lambda\alpha}\\ \bar{A}\bar{\alpha}=\bar{\lambda}\bar{\alpha}\\ Aαˉ=λαˉAˉαˉ=λˉαˉ
因为 A A A是实对称矩阵，所以 A ˉ = A \bar{A}=A Aˉ=A
A α ˉ = λ ˉ α ˉ α T A α ˉ = λ ˉ α T α ˉ A\bar{\alpha}=\bar{\lambda}\bar{\alpha}\\\ \alpha^TA\bar{\alpha}=\bar{\lambda}\alpha^T\bar{\alpha}\\ Aαˉ=λˉαˉ αTAαˉ=λˉαTαˉ
因为 α T A α ˉ \alpha^TA\bar{\alpha} αTAαˉ与 α T α ˉ \alpha^T\bar{\alpha} αTαˉ都是数，所以：
α T A α ˉ = ( α T A α ˉ ) T = λ α ˉ T α = λ α T α ˉ α T α ˉ = ( α T α ˉ ) T = α ˉ T α ⇓ ( λ − λ ˉ ) α T α ˉ = 0 \alpha^TA\bar{\alpha}=(\alpha^TA\bar{\alpha})^T=\lambda\bar{\alpha}^T\alpha=\lambda\alpha^T\bar{\alpha}\\ \alpha^T\bar{\alpha}=(\alpha^T\bar{\alpha})^T=\bar{\alpha}^T\alpha\\ \Downarrow\\ (\lambda-\bar{\lambda})\alpha^T\bar{\alpha}=0 αTAαˉ=(αTAαˉ)T=λαˉTα=λαTαˉαTαˉ=(αTαˉ)T=αˉTα⇓(λ−λˉ)αTαˉ=0
因为 α ≠ O \alpha\neq O α=O，所以 α T α ˉ > 0 \alpha^T\bar{\alpha}>0 αTαˉ>0，因此 λ = λ ˉ \lambda=\bar{\lambda} λ=λˉ
实对称矩阵 A A A的不同特征值 λ 1 , λ 2 \lambda_1,\lambda_2 λ1,λ2所对应的特征向量 α 1 , α 2 \alpha_1,\alpha_2 α1,α2必正交。
证明：由 A α 1 = λ 1 α 1 , A α 2 = λ 2 α 2 , λ 1 ≠ λ 2 A\alpha_1=\lambda_1\alpha_1,A\alpha_2=\lambda_2\alpha_2,\lambda_1\neq\lambda_2 Aα1=λ1α1,Aα2=λ2α2,λ1=λ2得：
λ 1 α 2 T α 1 = α 2 T A α 1 = α 2 T A T α 1 = ( A α 2 ) T α 1 = ( λ 2 α 2 ) T α 1 = λ 2 α 2 T α 1 ⇓ ( λ 1 − λ 2 ) α 2 T α 1 = 0 \lambda_1\alpha_2^T\alpha_1=\alpha_2^TA\alpha_1=\alpha_2^TA^T\alpha_1=(A\alpha_2)^T\alpha_1=(\lambda_2\alpha_2)^T\alpha_1=\lambda_2\alpha_2^T\alpha_1\\ \Downarrow\\ (\lambda_1-\lambda_2)\alpha_2^T\alpha_1=0\\ λ1α2Tα1=α2TAα1=α2TATα1=(Aα2)Tα1=(λ2α2)Tα1=λ2α2Tα1⇓(λ1−λ2)α2Tα1=0
因为 λ 1 ≠ λ 2 \lambda_1\neq\lambda_2 λ1=λ2，所以 α 2 T α 1 = 0 \alpha_2^T\alpha_1=0 α2Tα1=0
n n n阶实对称矩阵 A A A必可对角化，且总存在正交矩阵 Q Q Q，使得
Q − 1 A Q = Q T A Q = [ λ 1 λ 2 ⋱ λ n ] Q^{-1}AQ=Q^TAQ= \begin{bmatrix} \lambda_1&&&\\ &\lambda_2&&\\ &&\ddots&\\ &&&\lambda_n\\ \end{bmatrix} Q−1AQ=QTAQ= λ1λ2⋱λn
其中 λ 1 , λ 2 , … , λ n \lambda_1,\lambda_2,\dots,\lambda_n λ1,λ2,…,λn是 A A A的特征值。