线性代数——特征值和特征向量

编程入门 行业动态 更新时间:2024-10-22 17:31:35

线性代数——<a href=https://www.elefans.com/category/jswz/34/1698647.html style=特征值和特征向量"/>

线性代数——特征值和特征向量

系列文章目录

  • 学习高等数学和线性代数需要的初等数学知识
  • 线性代数——行列式
  • 线性代数——矩阵
  • 线性代数——向量
  • 线性代数——线性方程组
  • 线性代数——特征值和特征向量
  • 线性代数——二次型

文章目录

  • 系列文章目录
  • 版权声明
  • 向量内积
  • 正交矩阵
  • 特征值和特征向量
  • 相似矩阵
  • 相似对角化
  • 实对称矩阵

版权声明

本文大部分内容皆来自李永乐老师考研教材和视频课。

向量内积

设 α = ( a 1 , a 2 , … , a n ) T , β = ( b 1 , b 2 , … , b n ) T \alpha=(a_1,a_2,\dots,a_n)^T,\beta=(b_1,b_2,\dots,b_n)^T α=(a1​,a2​,…,an​)T,β=(b1​,b2​,…,bn​)T,令
( α , β ) = a 1 b 1 + a 2 b 2 , + ⋯ + a n b n (\alpha,\beta)=a_1b_1+a_2b_2,+\dots+a_nb_n (α,β)=a1​b1​+a2​b2​,+⋯+an​bn​
则称其为向量 α \alpha α和 β \beta β的内积。如果 ( α , β ) = 0 (\alpha,\beta)=0 (α,β)=0,则称 α \alpha α与 β \beta β正交,记作
A ⊥ B A\perp B A⊥B
向量 α \alpha α的长度为 ( α , α ) \sqrt{(\alpha,\alpha)} (α,α) ​,记作
∣ ∣ α ∣ ∣ = ( α , α ) = a 1 2 + a 2 2 + ⋯ + a n 2 ||\alpha||=\sqrt{(\alpha,\alpha)}=\sqrt{a_1^2+a_2^2+\dots+a_n^2} ∣∣α∣∣=(α,α) ​=a12​+a22​+⋯+an2​
长度为 1 1 1的向量称为单位向量。内积的性质如下:

  • ( α , β ) = ( β , α ) (\alpha,\beta)=(\beta,\alpha) (α,β)=(β,α)
  • ( α + β , γ ) = ( α , γ ) + ( β , γ ) (\alpha+\beta,\gamma)=(\alpha,\gamma)+(\beta,\gamma) (α+β,γ)=(α,γ)+(β,γ)
  • ( k α , β ) = k ( α , β ) (k\alpha,\beta)=k(\alpha,\beta) (kα,β)=k(α,β)
  • ( α , α ) = 0 ⇔ α = O (\alpha,\alpha)=0\Leftrightarrow\alpha=O (α,α)=0⇔α=O
  • 柯西-施瓦茨不等式: ( α , β ) 2 ≤ ∣ ∣ α ∣ ∣ 2 ∣ ∣ β ∣ ∣ 2 (\alpha,\beta)^2\leq||\alpha||^2||\beta||^2 (α,β)2≤∣∣α∣∣2∣∣β∣∣2,当且仅当 α \alpha α和 β \beta β线性相关时等号成立。
    证明:若 α , β \alpha,\beta α,β线性无关,则 ∀ \forall ∀实数 x x x有:
    x α + β ≠ O ⇓ ( x α + β , x α + β ) = ( α , α ) x 2 + 2 ( α , β ) x + ( β , β ) > 0 x\alpha+\beta\neq O\\ \Downarrow\\ (x\alpha+\beta,x\alpha+\beta)=(\alpha,\alpha)x^2+2(\alpha,\beta)x+(\beta,\beta)>0 xα+β=O⇓(xα+β,xα+β)=(α,α)x2+2(α,β)x+(β,β)>0
    作为 x x x的二次函数, ∀ x \forall x ∀x其函数值恒大于 0 0 0,所以:
    [ 2 ( α , β ) ] 2 − 4 ( α , α ) ( β , β ) < 0 ⇓ ( α , β ) 2 < ∣ ∣ α ∣ ∣ 2 ∣ ∣ β ∣ ∣ 2 [2(\alpha,\beta)]^2-4(\alpha,\alpha)(\beta,\beta)<0\\ \Downarrow\\ (\alpha,\beta)^2<||\alpha||^2||\beta||^2 [2(α,β)]2−4(α,α)(β,β)<0⇓(α,β)2<∣∣α∣∣2∣∣β∣∣2
    若 α , β \alpha,\beta α,β线性相关,当 α = O \alpha=O α=O或 β = O \beta=O β=O时:
    ( α , β ) 2 = ∣ ∣ α ∣ ∣ 2 ∣ ∣ β ∣ ∣ 2 = 0 (\alpha,\beta)^2=||\alpha||^2||\beta||^2=0 (α,β)2=∣∣α∣∣2∣∣β∣∣2=0
    当 β = k α ≠ O \beta=k\alpha\neq O β=kα=O时:
    ( α , β ) 2 = ( α , k α ) 2 = k 2 ( α , α ) 2 = ( α , α ) ( k α , k α ) = ∣ ∣ α ∣ ∣ 2 ∣ ∣ β ∣ ∣ 2 (\alpha,\beta)^2=(\alpha,k\alpha)^2=k^2(\alpha,\alpha)^2=(\alpha,\alpha)(k\alpha,k\alpha)=||\alpha||^2||\beta||^2 (α,β)2=(α,kα)2=k2(α,α)2=(α,α)(kα,kα)=∣∣α∣∣2∣∣β∣∣2
  • 若 n n n维向量组 α 1 , α 2 , … , α r \alpha_1,\alpha_2,\dots,\alpha_r α1​,α2​,…,αr​是一组两两正交的非零向量,则 α 1 , α 2 , … , α r \alpha_1,\alpha_2,\dots,\alpha_r α1​,α2​,…,αr​线性无关。
    证明:设
    k 1 α 1 + k 2 α 2 + ⋯ + k r α r = O ① \tag*{①}k_1\alpha_1+k_2\alpha_2+\dots+k_r\alpha_r=O k1​α1​+k2​α2​+⋯+kr​αr​=O①
    则必有 k 1 = 0 , k 2 = 0 , … , k r = 0 k_1=0,k_2=0,\dots,k_r=0 k1​=0,k2​=0,…,kr​=0,用 α 1 \alpha_1 α1​对①两边做内积得:
    ( α 1 , k 1 α 1 + k 2 α 2 + ⋯ + k r α r ) = ( α 1 , O ) ⇓ k 1 ( α 1 , α 1 ) + k 2 ( α 1 , α 2 ) + ⋯ + k r ( α 1 , α r ) = 0 ⇓ k 1 ( α 1 , α 1 ) = 0 (\alpha_1,k_1\alpha_1+k_2\alpha_2+\dots+k_r\alpha_r)=(\alpha_1,O)\\ \Downarrow\\ k_1(\alpha_1,\alpha_1)+k_2(\alpha_1,\alpha_2)+\dots+k_r(\alpha_1,\alpha_r)=0\\ \Downarrow\\ k_1(\alpha_1,\alpha_1)=0 (α1​,k1​α1​+k2​α2​+⋯+kr​αr​)=(α1​,O)⇓k1​(α1​,α1​)+k2​(α1​,α2​)+⋯+kr​(α1​,αr​)=0⇓k1​(α1​,α1​)=0
    因 α 1 ≠ 0 , ( α 1 , α 1 ) > 0 \alpha_1\neq0,(\alpha_1,\alpha_1)>0 α1​=0,(α1​,α1​)>0,所以必有 k 1 = 0 k_1=0 k1​=0,同理可证 k 2 = 0 , … , k r = 0 k_2=0,\dots,k_r=0 k2​=0,…,kr​=0。
  • Schmidt正交化:设 α 1 , α 2 , α 3 \alpha_1,\alpha_2,\alpha_3 α1​,α2​,α3​线性无关,令
    β 1 = α 1 β 2 = α 2 − ( α 2 , β 1 ) ( β 1 , β 1 ) β 1 β 3 = α 3 − ( α 3 , β 1 ) ( β 1 , β 1 ) β 1 − ( α 3 , β 2 ) ( β 2 , β 2 ) β 2 \beta_1=\alpha_1\\ \beta_2=\alpha_2-\frac{(\alpha_2,\beta_1)}{(\beta_1,\beta_1)}\beta_1\\ \beta_3=\alpha_3-\frac{(\alpha_3,\beta_1)}{(\beta_1,\beta_1)}\beta_1-\frac{(\alpha_3,\beta_2)}{(\beta_2,\beta_2)}\beta_2 β1​=α1​β2​=α2​−(β1​,β1​)(α2​,β1​)​β1​β3​=α3​−(β1​,β1​)(α3​,β1​)​β1​−(β2​,β2​)(α3​,β2​)​β2​
    那么 β 1 , β 2 , β 3 \beta_1,\beta_2,\beta_3 β1​,β2​,β3​两两正交,将其单位化有:
    γ 1 = β 1 ∣ ∣ β 1 ∣ ∣ , γ 2 = β 2 ∣ ∣ β 2 ∣ ∣ , γ 3 = β 3 ∣ ∣ β 3 ∣ ∣ \gamma_1=\frac{\beta_1}{||\beta_1||},\gamma_2=\frac{\beta_2}{||\beta_2||},\gamma_3=\frac{\beta_3}{||\beta_3||} γ1​=∣∣β1​∣∣β1​​,γ2​=∣∣β2​∣∣β2​​,γ3​=∣∣β3​∣∣β3​​
    则 α 1 , α 2 , α 3 \alpha_1,\alpha_2,\alpha_3 α1​,α2​,α3​到 γ 1 , γ 2 , γ 3 \gamma_1,\gamma_2,\gamma_3 γ1​,γ2​,γ3​这一过程称为Schmidt正交化

正交矩阵

设 A A A是 n n n阶矩阵,满足
A A T = A T A = E AA^T=A^TA=E AAT=ATA=E
则称 A A A为正交矩阵。正交矩阵的性质如下:

  • A A A是正交矩阵 ⇔ A T = A − 1 \Leftrightarrow A^T=A^{-1} ⇔AT=A−1
  • A = [ α 1 , α 2 , α 3 ] A=[\alpha_1,\alpha_2,\alpha_3] A=[α1​,α2​,α3​]是正交矩阵 ⇔ α 1 , α 2 , α 3 \Leftrightarrow \alpha_1,\alpha_2,\alpha_3 ⇔α1​,α2​,α3​都是单位向量,且两两正交。
    证明:
    A T A = [ α 1 T α 2 T α 3 T ] [ α 1 α 2 α 3 ] = [ α 1 T α 1 α 1 T α 2 α 1 T α 3 α 2 T α 1 α 2 T α 2 α 2 T α 3 α 3 T α 1 α 3 T α 2 α 3 T α 3 ] = [ 1 0 0 0 1 0 0 0 1 ] A^TA= \begin{bmatrix} \alpha_1^T\\ \alpha_2^T\\ \alpha_3^T\\ \end{bmatrix} \begin{bmatrix} \alpha_1&\alpha_2&\alpha_3 \end{bmatrix} = \begin{bmatrix} \alpha_1^T\alpha_1&\alpha_1^T\alpha_2&\alpha_1^T\alpha_3\\\ \alpha_2^T\alpha_1&\alpha_2^T\alpha_2&\alpha_2^T\alpha_3\\ \alpha_3^T\alpha_1&\alpha_3^T\alpha_2&\alpha_3^T\alpha_3\\ \end{bmatrix} =\begin{bmatrix} 1&0&0\\ 0&1&0\\ 0&0&1 \end{bmatrix}\\ ATA= ​α1T​α2T​α3T​​ ​[α1​​α2​​α3​​]= ​α1T​α1​ α2T​α1​α3T​α1​​α1T​α2​α2T​α2​α3T​α2​​α1T​α3​α2T​α3​α3T​α3​​ ​= ​100​010​001​
  • 如果 A A A是正交矩阵,则 ∣ A ∣ = 1 |A|=1 ∣A∣=1或 − 1 -1 −1。
    证明:
    A A T = E ∣ A A T ∣ = ∣ E ∣ ∣ A ∣ ∣ A T ∣ = 1 ∣ A ∣ 2 = 1 AA^T=E\\ |AA^T|=|E|\\ |A||A^T|=1\\ |A|^2=1 AAT=E∣AAT∣=∣E∣∣A∣∣AT∣=1∣A∣2=1
  • 若 A , B A,B A,B都是正交矩阵,则 A B AB AB也是正交矩阵。
    证明:
    ( A B ) ( A B ) T = A B B T A T = A E A T = E (AB)(AB)^T=ABB^TA^T=AEA^T=E\\ (AB)(AB)T=ABBTAT=AEAT=E

特征值和特征向量

设 A = [ a i j ] A=[a_{ij}] A=[aij​]为一个 n n n阶矩阵,如果存在一个数 λ \lambda λ及非零的 n n n维列向量 α \alpha α,使得
A α = λ α ① \tag*{①} A\alpha=\lambda\alpha Aα=λα①
成立,则称 λ \lambda λ是矩阵 A A A的一个特征值,称 α \alpha α是矩阵 A A A属于特征值 λ \lambda λ的一个特征向量。由①可知
( λ E − A ) α = O , α ≠ O (\lambda E-A)\alpha=O,\alpha\neq O (λE−A)α=O,α=O
即 α \alpha α是齐次线性方程组
( λ E − A ) x = O ② \tag*{②}(\lambda E-A)x=O (λE−A)x=O②

的解,由克拉默法则可知, n n n个未知数、 n n n个方程的齐次线性方程组有非零解,则系数行列式
∣ λ E − A ∣ = ∣ λ − a 11 − a 12 … − a 1 n − a 21 λ − a 22 … − a 2 n ⋮ ⋮ ⋮ − a n 1 − a n 2 … λ − a n n ∣ = 0 |\lambda E-A|= \begin{vmatrix} \lambda-a_{11}&-a_{12}&\dots&-a_{1n}\\ -a_{21}&\lambda-a_{22}&\dots&-a_{2n}\\ \vdots&\vdots&&\vdots\\ -a_{n1}&-a_{n2}&\dots&\lambda-a_{nn} \end{vmatrix} =0 ∣λE−A∣= ​λ−a11​−a21​⋮−an1​​−a12​λ−a22​⋮−an2​​………​−a1n​−a2n​⋮λ−ann​​ ​=0
称 ∣ λ E − A ∣ |\lambda E-A| ∣λE−A∣为 A A A的特征多项式, ∣ λ E − A ∣ = 0 |\lambda E-A|=0 ∣λE−A∣=0为 A A A的特征方程。那么求方阵 A A A特征向量的步骤如下:

  • 先由特征方程求出 A A A的特征值 λ i \lambda_i λi​,共 n n n个(含重根)。
  • 再由②求其通解 ,即矩阵 A A A属于特征值 λ i \lambda_i λi​的线性无关的特征向量。

特征值和特征向量的性质如下:

  • ( A + k E ) α = ( λ + k ) α (A+kE)\alpha=(\lambda+k)\alpha (A+kE)α=(λ+k)α
  • f ( A ) α = f ( λ ) α f(A)\alpha=f(\lambda)\alpha f(A)α=f(λ)α
  • A n α = λ n α A^n\alpha=\lambda^n\alpha Anα=λnα
  • A − 1 α = 1 λ α A^{-1}\alpha=\frac{1}{\lambda}\alpha A−1α=λ1​α
  • A ∗ α = ∣ A ∣ λ α A^*\alpha=\frac{|A|}{\lambda}\alpha A∗α=λ∣A∣​α
    证明:由 A α 1 = λ α 1 , A α 2 = λ α 2 A\alpha_1=\lambda\alpha_1,A\alpha_2=\lambda\alpha_2 Aα1​=λα1​,Aα2​=λα2​得:
    A ( k 1 α 1 + k 2 α 2 ) = k 1 A α 1 + k 2 A α 2 = k 1 ( λ α 1 ) + k 2 ( λ α 2 ) = λ ( k 1 α 1 + k 2 α 2 2 ) A(k_1\alpha_1+k_2\alpha_2)=k_1A\alpha_1+k_2A\alpha_2=k_1(\lambda\alpha_1)+k_2(\lambda\alpha_2)=\lambda(k_1\alpha_1+k_2\alpha_22) A(k1​α1​+k2​α2​)=k1​Aα1​+k2​Aα2​=k1​(λα1​)+k2​(λα2​)=λ(k1​α1​+k2​α2​2)
  • 设 A A A是 n n n阶矩阵, λ 1 , λ 2 , … , λ n \lambda_1,\lambda_2,\dots,\lambda_n λ1​,λ2​,…,λn​是矩阵 A A A的特征值,则:
    ∑ λ i = ∑ a i i , ∏ λ i = ∣ A ∣ \sum\lambda_i=\sum a_{ii},\prod\lambda_i=|A| ∑λi​=∑aii​,∏λi​=∣A∣
    证明:设三阶矩阵 A A A,则有
    ∣ λ E − A ∣ = ∣ λ − a 11 − a 12 − a 13 − a 21 λ − a 22 − a 23 − a 31 − a 32 λ − a 33 ∣ = ∣ λ − a 12 − a 13 0 λ − a 22 − a 23 0 − a 32 λ − a 33 ∣ + ∣ − a 11 − a 12 − a 13 − a 21 λ − a 22 − a 23 − a 31 − a 32 λ − a 33 ∣ = ∣ λ 0 − a 13 0 λ − a 23 0 0 λ − a 33 ∣ + ∣ λ − a 12 − a 13 0 − a 22 − a 23 0 − a 32 λ − a 33 ∣ + ∣ − a 11 0 − a 13 − a 21 λ − a 23 − a 31 0 λ − a 33 ∣ + ∣ − a 11 − a 12 − a 13 − a 21 − a 22 − a 23 − a 31 − a 32 λ − a 33 ∣ … = λ 3 − ( a 11 + a 22 + a 33 ) λ 2 + S λ − ∣ A ∣ |\lambda E-A|= \begin{vmatrix} \lambda-a_{11}&-a_{12}&-a_{13}\\ -a_{21}&\lambda-a_{22}&-a_{23}\\ -a_{31}&-a_{32}&\lambda-a_{33} \end{vmatrix}\\ = \begin{vmatrix} \lambda&-a_{12}&-a_{13}\\ 0&\lambda-a_{22}&-a_{23}\\ 0&-a_{32}&\lambda-a_{33} \end{vmatrix} {+} \begin{vmatrix} -a_{11}&-a_{12}&-a_{13}\\ -a_{21}&\lambda-a_{22}&-a_{23}\\ -a_{31}&-a_{32}&\lambda-a_{33} \end{vmatrix}\\ = \begin{vmatrix} \lambda&0&-a_{13}\\ 0&\lambda&-a_{23}\\ 0&0&\lambda-a_{33} \end{vmatrix} {+} \begin{vmatrix} \lambda&-a_{12}&-a_{13}\\ 0&-a_{22}&-a_{23}\\ 0&-a_{32}&\lambda-a_{33} \end{vmatrix} {+} \begin{vmatrix} -a_{11}&0&-a_{13}\\ -a_{21}&\lambda&-a_{23}\\ -a_{31}&0&\lambda-a_{33} \end{vmatrix} {+} \begin{vmatrix} -a_{11}&-a_{12}&-a_{13}\\ -a_{21}&-a_{22}&-a_{23}\\ -a_{31}&-a_{32}&\lambda-a_{33} \end{vmatrix}\\ \dots\\ =\lambda^3-(a_{11}+a_{22}+a_{33})\lambda^2+S\lambda-|A| ∣λE−A∣= ​λ−a11​−a21​−a31​​−a12​λ−a22​−a32​​−a13​−a23​λ−a33​​ ​= ​λ00​−a12​λ−a22​−a32​​−a13​−a23​λ−a33​​ ​+ ​−a11​−a21​−a31​​−a12​λ−a22​−a32​​−a13​−a23​λ−a33​​ ​= ​λ00​0λ0​−a13​−a23​λ−a33​​ ​+ ​λ00​−a12​−a22​−a32​​−a13​−a23​λ−a33​​ ​+ ​−a11​−a21​−a31​​0λ0​−a13​−a23​λ−a33​​ ​+ ​−a11​−a21​−a31​​−a12​−a22​−a32​​−a13​−a23​λ−a33​​ ​…=λ3−(a11​+a22​+a33​)λ2+Sλ−∣A∣
    设特征方程的解为 λ 1 , λ 2 , λ 3 \lambda_1,\lambda_2,\lambda_3 λ1​,λ2​,λ3​,那么
    λ 3 − ( a 11 + a 22 + a 33 ) λ 2 + S λ − ∣ A ∣ = ( λ − λ 1 ) ( λ − λ 2 ) ( λ − λ 3 ) = λ 3 − ( λ 1 + λ 2 + λ 3 ) λ 2 + S λ − λ 1 λ 2 λ 3 \lambda^3-(a_{11}+a_{22}+a_{33})\lambda^2+S\lambda-|A|= (\lambda-\lambda_1)(\lambda-\lambda_2)(\lambda-\lambda_3)=\lambda^3-(\lambda_1+\lambda_2+\lambda_3)\lambda^2+S\lambda-\lambda_1\lambda_2\lambda_3 λ3−(a11​+a22​+a33​)λ2+Sλ−∣A∣=(λ−λ1​)(λ−λ2​)(λ−λ3​)=λ3−(λ1​+λ2​+λ3​)λ2+Sλ−λ1​λ2​λ3​
    所以
    ∑ λ i = ∑ a i i , ∏ λ i = ∣ A ∣ \sum\lambda_i=\sum a_{ii},\prod\lambda_i=|A| ∑λi​=∑aii​,∏λi​=∣A∣
    其中 S S S为一次项的系数,不重要。
  • 如果 A = ( a i j ) A=(a_{ij}) A=(aij​)是 3 3 3阶矩阵,则 A A A的特征多项式 ∣ λ E − A ∣ = λ 3 − ( a 11 + a 22 + a 33 ) λ 2 + s 2 λ − ∣ A ∣ \begin{vmatrix}\lambda E-A \end{vmatrix}=\lambda^{3}-(a_{11}+a_{22}+a_{33})\lambda^2+s_2\lambda-|A| ​λE−A​ ​=λ3−(a11​+a22​+a33​)λ2+s2​λ−∣A∣其中 s 2 = ∣ a 11 a 12 a 21 a 22 ∣ + ∣ a 11 a 13 a 31 a 33 ∣ + ∣ a 11 a 22 a 32 a 33 ∣ s_2=\begin{vmatrix}a_{11}&a_{12}\\a_{21}&a_{22}\end{vmatrix}+\begin{vmatrix}a_{11}&a_{13}\\a_{31}&a_{33}\end{vmatrix}+\begin{vmatrix}a_{11}&a_{22}\\a_{32}&a_{33}\end{vmatrix} s2​= ​a11​a21​​a12​a22​​ ​+ ​a11​a31​​a13​a33​​ ​+ ​a11​a32​​a22​a33​​
  • 如果 A = ( a i j ) A=(a_{ij}) A=(aij​)是 n n n阶矩阵,且 r ( A ) = 1 r(A)=1 r(A)=1,则 ∣ λ E − A ∣ = λ n − ∑ a i i λ n − 1 |\lambda E-A|=\lambda^n-\sum a_{ii}\lambda^{n-1} ∣λE−A∣=λn−∑aii​λn−1
  • 如果 α 1 , α 2 … , α t \alpha_1,\alpha_2\dots,\alpha_t α1​,α2​…,αt​都是属于矩阵 A A A的特征值 λ \lambda λ的特征向量,那么当 k 1 α 1 + k 2 α 2 + ⋯ + k t α t k_1\alpha_1+k_2\alpha_2+\dots+k_t\alpha_t k1​α1​+k2​α2​+⋯+kt​αt​非零时, k 1 α 1 + k 2 α 2 + ⋯ + k t α t k_1\alpha_1+k_2\alpha_2+\dots+k_t\alpha_t k1​α1​+k2​α2​+⋯+kt​αt​仍然是属于矩阵 A A A的特征值 λ \lambda λ的特征向量。
  • 如果 λ 1 , λ 2 , … , λ m \lambda_1,\lambda_2,\dots,\lambda_m λ1​,λ2​,…,λm​是矩阵 A A A的互不相同的特征值, α 1 , α 2 … , α m \alpha_1,\alpha_2\dots,\alpha_m α1​,α2​…,αm​分别是与之对应的特征向量,则 α 1 , α 2 … , α m \alpha_1,\alpha_2\dots,\alpha_m α1​,α2​…,αm​线性无关。
    证明:对特征值的个数 m m m做数学归纳法,当 m = 1 m=1 m=1时, α 1 ≠ O \alpha_1\neq O α1​=O,命题正确。设 m = k − 1 m=k-1 m=k−1时命题正确,当 m = k m=k m=k时,设
    x 1 α 1 + x 2 α 2 + ⋯ + x k − 1 α k − 1 + x k α k = O ① \tag*{①}x_1\alpha_1+x_2\alpha_2+\dots+x_{k-1}\alpha_{k-1}+x_k\alpha_k=O x1​α1​+x2​α2​+⋯+xk−1​αk−1​+xk​αk​=O①
    用 A A A左乘上式有
    x 1 λ 1 α 1 + x 2 λ 2 α 2 + ⋯ + x k − 1 λ k − 1 α k − 1 + x k λ k α k = O ② \tag*{②}x_1\lambda_1\alpha_1+x_2\lambda_2\alpha_2+\dots+x_{k-1}\lambda_{k-1}\alpha_{k-1}+x_k\lambda_k\alpha_k=O x1​λ1​α1​+x2​λ2​α2​+⋯+xk−1​λk−1​αk−1​+xk​λk​αk​=O②
    用 λ k \lambda_k λk​乘①得
    x 1 λ k α 1 + x 2 λ k α 2 + ⋯ + x k − 1 λ k α k − 1 + x k λ k α k = O ③ \tag*{③}x_1\lambda_k\alpha_1+x_2\lambda_k\alpha_2+\dots+x_{k-1}\lambda_{k}\alpha_{k-1}+x_k\lambda_k\alpha_k=O x1​λk​α1​+x2​λk​α2​+⋯+xk−1​λk​αk−1​+xk​λk​αk​=O③
    ② − - −③得
    x 1 ( λ 1 − λ k ) α 1 + x 2 ( λ 2 − λ k ) α 2 + ⋯ + x k − 1 ( λ k − 1 − λ k ) α k − 1 = O x_1(\lambda_1-\lambda_k)\alpha_1+x_2(\lambda_2-\lambda_k)\alpha_2+\dots+x_{k-1}(\lambda_{k-1}-\lambda_k)\alpha_{k-1}=O x1​(λ1​−λk​)α1​+x2​(λ2​−λk​)α2​+⋯+xk−1​(λk−1​−λk​)αk−1​=O
    又因为 λ i ≠ λ j \lambda_i\neq\lambda_j λi​=λj​且 m = k − 1 m=k-1 m=k−1时命题成立,所以
    x 1 = 0 , x 2 = 0 , … , x k − 1 = 0 x_1=0,x_2=0,\dots,x_{k-1}=0 x1​=0,x2​=0,…,xk−1​=0
    代入①得
    x k α k = O x_k\alpha_k=O xk​αk​=O
    所以 x k = 0 x_k=0 xk​=0,即使 x 1 = 0 , x 2 = 0 , … , x k = 0 x_1=0,x_2=0,\dots,x_{k}=0 x1​=0,x2​=0,…,xk​=0,因此 α 1 , α 2 … , α m \alpha_1,\alpha_2\dots,\alpha_m α1​,α2​…,αm​线性无关。
  • 如果 A A A是 n n n阶矩阵, λ \lambda λ是 A A A的 m m m重特征值,则属于 λ \lambda λ的线性无关的特征向量最多有 m m m个。

相似矩阵

设 A , B A,B A,B都是 n n n阶矩阵,如果存在可逆矩阵 P P P,使得
P − 1 A P = B P^{-1}AP=B P−1AP=B
则称矩阵 A A A和 B B B相似,记作 A ∼ B A\thicksim B A∼B
相似矩阵的性质如下:

  • A ∼ A A\thicksim A A∼A
  • A ∼ B ⇔ B ∼ A A\thicksim B\Leftrightarrow B\thicksim A A∼B⇔B∼A
  • A ∼ B , B ∼ A ⇒ A ∼ C A\thicksim B,B\thicksim A\Rightarrow A\thicksim C A∼B,B∼A⇒A∼C
    证明:设 P 1 − 1 A P 1 = B , P 2 − 1 B P 2 = C P_1^{-1}AP_1=B,P_2^{-1}BP_2=C P1−1​AP1​=B,P2−1​BP2​=C则
    P 2 − 1 ( P 1 − 1 A P 1 ) P 2 = C P_2^{-1}(P_1^{-1}AP_1)P_2=C P2−1​(P1−1​AP1​)P2​=C
    令 P = P 1 P 2 P=P_1P_2 P=P1​P2​,有 P − 1 = ( P 1 P 2 ) − 1 = P 2 − 1 P 1 − 1 P^{-1}=(P_1P_2)^{-1}=P_2^{-1}P_1^{-1} P−1=(P1​P2​)−1=P2−1​P1−1​,所以 P − 1 A P = C P^{-1}AP=C P−1AP=C。
  • A 1 ∼ B 1 , A 2 ∼ B 2 ⇒ [ A 1 A 2 ] ∼ [ B 1 B 2 ] A_1\thicksim B_1,A_2\thicksim B_2 \Rightarrow\begin{bmatrix}A_1&\\&A_2\end{bmatrix}\thicksim\begin{bmatrix}B_1&\\&B_2\end{bmatrix} A1​∼B1​,A2​∼B2​⇒[A1​​A2​​]∼[B1​​B2​​]
  • A ∼ B A\thicksim B A∼B
    ⇒ A n ∼ B n \Rightarrow A^n\thicksim B^n ⇒An∼Bn
    ⇒ ( A + k E ) n ∼ ( B + k E ) n \Rightarrow (A+kE)^n\thicksim (B+kE)^n ⇒(A+kE)n∼(B+kE)n
    ⇒ A T ∼ B T \Rightarrow A^T\thicksim B^T ⇒AT∼BT
    ⇒ \Rightarrow ⇒如果 A A A可逆,则 A − 1 ∼ B − 1 A^{-1}\thicksim B^{-1} A−1∼B−1
    ⇒ r ( A ) = r ( B ) \Rightarrow r(A)=r(B) ⇒r(A)=r(B)
    ⇒ ∣ A ∣ = ∣ B ∣ \Rightarrow |A|=|B| ⇒∣A∣=∣B∣
    ⇒ ∣ λ E − A ∣ = ∣ λ E − B ∣ \Rightarrow |\lambda E-A|=|\lambda E-B| ⇒∣λE−A∣=∣λE−B∣
    ⇒ λ A = λ B \Rightarrow \lambda_A=\lambda_B ⇒λA​=λB​
    ⇒ A \Rightarrow A ⇒A对应于 λ \lambda λ的特征向量为 α \alpha α,则 B B B对应于 λ \lambda λ的特征向量为 P − 1 A P^{-1}A P−1A
    ⇒ B \Rightarrow B ⇒B对应于 λ \lambda λ的特征向量为 α \alpha α,则 A A A对应于 λ \lambda λ的特征向量为 P A PA PA

判断两个矩阵相似的方法如下:

  • 特征值是否相等
  • 如果某个矩阵是实对称矩阵,则判断另一个矩阵是否可相似对角化
  • 判断特征值特征向量的个数

相似对角化

如果 A A A能与对角矩阵相似,则称 A A A可对角化
P − 1 A P = Λ A P = P Λ P^{-1}AP=\Lambda\\ AP=P\Lambda P−1AP=ΛAP=PΛ
假设 A A A是三阶矩阵,对 P P P按列分块:
A [ p 1 , p 2 , p 3 ] = [ p 1 , p 2 , p 3 ] [ λ 1 λ 2 λ 3 ] ⇓ [ A p 1 , A p 2 , A p 3 ] = [ λ 1 p 1 , λ 2 p 2 , λ 3 p 3 ] ⇓ A p 1 = λ 1 p 1 , A p 2 = λ 2 p 2 , A p 3 = λ 3 p 3 A[p_1,p_2,p_3]=[p_1,p_2,p_3] \begin{bmatrix} \lambda_1&&\\ &\lambda_2&\\ &&\lambda_3\\ \end{bmatrix}\\ \Downarrow\\ [Ap_1,Ap_2,Ap_3]=[\lambda_1p_1,\lambda_2p_2,\lambda_3p_3]\\ \Downarrow\\ Ap_1=\lambda_1p_1,Ap_2=\lambda_2p_2,Ap_3=\lambda_3p_3 A[p1​,p2​,p3​]=[p1​,p2​,p3​] ​λ1​​λ2​​λ3​​ ​⇓[Ap1​,Ap2​,Ap3​]=[λ1​p1​,λ2​p2​,λ3​p3​]⇓Ap1​=λ1​p1​,Ap2​=λ2​p2​,Ap3​=λ3​p3​
那么:

  • A A A的特征值: λ 1 , λ 2 , λ 3 \lambda_1,\lambda_2,\lambda_3 λ1​,λ2​,λ3​
  • A A A的特征向量: p 1 , p 2 , p 3 p_1,p_2,p_3 p1​,p2​,p3​

反之,若 A A A有 3 3 3个无关的特征向量 p 1 , p 2 , p 3 p_1,p_2,p_3 p1​,p2​,p3​,满足 A p i = λ i p i ( i = 1 , 2 , 3 ) Ap_i=\lambda_ip_i(i=1,2,3) Api​=λi​pi​(i=1,2,3),则有
A [ p 1 , p 2 , p 3 ] = [ p 1 , p 2 , p 3 ] [ λ 1 λ 2 λ 3 ] A[p_1,p_2,p_3]=[p_1,p_2,p_3] \begin{bmatrix} \lambda_1&&\\ &\lambda_2&\\ &&\lambda_3\\ \end{bmatrix} A[p1​,p2​,p3​]=[p1​,p2​,p3​] ​λ1​​λ2​​λ3​​
令 P = [ p 1 , p 2 , p 3 ] , Λ = [ λ 1 λ 2 λ 3 ] P=[p_1,p_2,p_3],\Lambda=\begin{bmatrix}\lambda_1&&\\&\lambda_2&\\&&\lambda_3\\\end{bmatrix} P=[p1​,p2​,p3​],Λ= ​λ1​​λ2​​λ3​​ ​,则
P − 1 A P = Λ P^{-1}AP=\Lambda P−1AP=Λ
矩阵对角化的性质如下:

  • n n n阶矩阵 A A A可对角化
    ⇔ A \Leftrightarrow A ⇔A有 n n n个线性无关的特征向量
    ⇔ \Leftrightarrow ⇔ λ i \lambda_i λi​是 A A A的 n i n_i ni​重特征值,则 λ i \lambda_i λi​有 n i n_i ni​个线性无关的特征向量
    ⇔ \Leftrightarrow ⇔秩 r ( λ E − A ) = n − n i r(\lambda E-A)=n-n_i r(λE−A)=n−ni​, λ i \lambda_i λi​为 n i n_i ni​重特征值。
  • 如果 A A A有 n n n个不同的特征值 λ 1 , λ 2 , … , λ n \lambda_1,\lambda_2,\dots,\lambda_n λ1​,λ2​,…,λn​,则 A A A可相似对角化,且
    A ∼ [ λ 1 λ 2 ⋱ λ n ] A\thicksim \begin{bmatrix} \lambda_1&&&\\ &\lambda_2&&\\ &&\ddots&\\ &&&\lambda_n\\ \end{bmatrix} A∼ ​λ1​​λ2​​⋱​λn​​
  • A 2 = A ⇒ A ∼ Λ A^2=A\Rightarrow A\thicksim\Lambda A2=A⇒A∼Λ
  • A 2 = E ⇒ A ∼ Λ A^2=E\Rightarrow A\thicksim\Lambda A2=E⇒A∼Λ
  • r ( A ) = 1 r(A)=1 r(A)=1且 t r ( A ) ≠ 0 ⇒ A ∼ Λ tr(A)\neq0\Rightarrow A\thicksim\Lambda tr(A)=0⇒A∼Λ

实对称矩阵

满足以下两个条件的方阵称为实对称矩阵

  • A = A T A=A^T A=AT
  • 矩阵的元素全为实数。

实对称矩阵的性质如下:

  • 若矩阵 A A A是实对称矩阵,则 A A A的特征值都是实数。
    证明:设 A α = λ α A\alpha=\lambda \alpha Aα=λα,则
    A α ˉ = λ α ˉ A ˉ α ˉ = λ ˉ α ˉ \bar{A\alpha}=\bar{\lambda\alpha}\\ \bar{A}\bar{\alpha}=\bar{\lambda}\bar{\alpha}\\ Aαˉ=λαˉAˉαˉ=λˉαˉ
    因为 A A A是实对称矩阵,所以 A ˉ = A \bar{A}=A Aˉ=A
    A α ˉ = λ ˉ α ˉ α T A α ˉ = λ ˉ α T α ˉ A\bar{\alpha}=\bar{\lambda}\bar{\alpha}\\\ \alpha^TA\bar{\alpha}=\bar{\lambda}\alpha^T\bar{\alpha}\\ Aαˉ=λˉαˉ αTAαˉ=λˉαTαˉ
    因为 α T A α ˉ \alpha^TA\bar{\alpha} αTAαˉ与 α T α ˉ \alpha^T\bar{\alpha} αTαˉ都是数,所以:
    α T A α ˉ = ( α T A α ˉ ) T = λ α ˉ T α = λ α T α ˉ α T α ˉ = ( α T α ˉ ) T = α ˉ T α ⇓ ( λ − λ ˉ ) α T α ˉ = 0 \alpha^TA\bar{\alpha}=(\alpha^TA\bar{\alpha})^T=\lambda\bar{\alpha}^T\alpha=\lambda\alpha^T\bar{\alpha}\\ \alpha^T\bar{\alpha}=(\alpha^T\bar{\alpha})^T=\bar{\alpha}^T\alpha\\ \Downarrow\\ (\lambda-\bar{\lambda})\alpha^T\bar{\alpha}=0 αTAαˉ=(αTAαˉ)T=λαˉTα=λαTαˉαTαˉ=(αTαˉ)T=αˉTα⇓(λ−λˉ)αTαˉ=0
    因为 α ≠ O \alpha\neq O α=O,所以 α T α ˉ > 0 \alpha^T\bar{\alpha}>0 αTαˉ>0,因此 λ = λ ˉ \lambda=\bar{\lambda} λ=λˉ
  • 实对称矩阵 A A A的不同特征值 λ 1 , λ 2 \lambda_1,\lambda_2 λ1​,λ2​所对应的特征向量 α 1 , α 2 \alpha_1,\alpha_2 α1​,α2​必正交。
    证明:由 A α 1 = λ 1 α 1 , A α 2 = λ 2 α 2 , λ 1 ≠ λ 2 A\alpha_1=\lambda_1\alpha_1,A\alpha_2=\lambda_2\alpha_2,\lambda_1\neq\lambda_2 Aα1​=λ1​α1​,Aα2​=λ2​α2​,λ1​=λ2​得:
    λ 1 α 2 T α 1 = α 2 T A α 1 = α 2 T A T α 1 = ( A α 2 ) T α 1 = ( λ 2 α 2 ) T α 1 = λ 2 α 2 T α 1 ⇓ ( λ 1 − λ 2 ) α 2 T α 1 = 0 \lambda_1\alpha_2^T\alpha_1=\alpha_2^TA\alpha_1=\alpha_2^TA^T\alpha_1=(A\alpha_2)^T\alpha_1=(\lambda_2\alpha_2)^T\alpha_1=\lambda_2\alpha_2^T\alpha_1\\ \Downarrow\\ (\lambda_1-\lambda_2)\alpha_2^T\alpha_1=0\\ λ1​α2T​α1​=α2T​Aα1​=α2T​ATα1​=(Aα2​)Tα1​=(λ2​α2​)Tα1​=λ2​α2T​α1​⇓(λ1​−λ2​)α2T​α1​=0
    因为 λ 1 ≠ λ 2 \lambda_1\neq\lambda_2 λ1​=λ2​,所以 α 2 T α 1 = 0 \alpha_2^T\alpha_1=0 α2T​α1​=0
  • n n n阶实对称矩阵 A A A必可对角化,且总存在正交矩阵 Q Q Q,使得
    Q − 1 A Q = Q T A Q = [ λ 1 λ 2 ⋱ λ n ] Q^{-1}AQ=Q^TAQ= \begin{bmatrix} \lambda_1&&&\\ &\lambda_2&&\\ &&\ddots&\\ &&&\lambda_n\\ \end{bmatrix} Q−1AQ=QTAQ= ​λ1​​λ2​​⋱​λn​​
    其中 λ 1 , λ 2 , … , λ n \lambda_1,\lambda_2,\dots,\lambda_n λ1​,λ2​,…,λn​是 A A A的特征值。

更多推荐

线性代数——特征值和特征向量

本文发布于:2024-03-23 18:43:41,感谢您对本站的认可!
本文链接:https://www.elefans.com/category/jswz/34/1741535.html
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。
本文标签:特征值   线性代数   向量   特征

发布评论

评论列表 (有 0 条评论)
草根站长

>www.elefans.com

编程频道|电子爱好者 - 技术资讯及电子产品介绍!