diff --git a/特征值.md b/特征值.md new file mode 100644 index 0000000..8d997ba --- /dev/null +++ b/特征值.md @@ -0,0 +1,297 @@ +# 第四章 方阵的相似化问题 + +## 4.1 特征值与特征向量 + +### 4.1.1 基本概念与求法 + +**定义 4.1** +设 $n$ 阶方阵 $A = [a_{ij}] \in \mathbb{C}^{n \times n}$,若存在数 $\lambda$ 和非零向量 $\xi$ 使得 +$$ +A\xi = \lambda \xi, +$$ +则称 $\lambda$ 是矩阵 $A$ 的一个**特征值**,$\xi$ 是矩阵 $A$ 对应于 $\lambda$ 的一个**特征向量**。 + +#### 特征值与特征向量的求法 + +由定义可得: +$$ +A\xi = \lambda \xi \quad \text{且} \quad \xi \neq 0. +$$ +等价地: +$$ +(\lambda E - A)\xi = 0 \quad \text{且} \quad \xi \neq 0. +$$ +这表明**特征向量 $\xi$** 是齐次线性方程组 $(\lambda E - A)x = 0$ 的**非零解**。该方程组有非零解当且仅当 +$$ +\operatorname{rank}(\lambda E - A) < n, +$$ +即 $\lambda E - A$ 是奇异矩阵(行列式为零)。 + +**求法步骤**: + +1. **求特征值** + 由 $|\lambda E - A| = 0$ 解出 $\lambda$ 的所有根 $\lambda_1, \lambda_2, \dots, \lambda_n$(包括重根)。 + +2. **求特征向量** + 对每个特征值 $\lambda_i$,代入齐次线性方程组 + $$ + (\lambda_i E - A)x = 0 + $$ + 求解,所得的全部非零解即为对应于 $\lambda_i$ 的特征向量。 + +#### 特征多项式与特征方程 + +**定义 4.2** +设 $A$ 为 $n$ 阶方阵,$\lambda$ 是一个变量,则矩阵 $\lambda E - A$ 称为 $A$ 的**特征矩阵**,其行列式 +$$ +f_A(\lambda) = |\lambda E - A| +$$ +称为 $A$ 的**特征多项式**,方程 $|\lambda E - A| = 0$ 称为 $A$ 的**特征方程**。 + +特征方程的根就是矩阵 $A$ 的特征值。 + +--- + +### 4.1.2 特征值与特征向量的性质 + +#### 特征值的积与和 + +**定理 4.1** +设 $n$ 阶方阵 $A = [a_{ij}] \in \mathbb{C}^{n \times n}$ 的 $n$ 个特征值为 $\lambda_1, \lambda_2, \dots, \lambda_n$(重根按重数计算),则: + +1. $\lambda_1 \lambda_2 \cdots \lambda_n = |A|$(特征值的积等于矩阵的行列式); +2. $\lambda_1 + \lambda_2 + \cdots + \lambda_n = a_{11} + a_{22} + \cdots + a_{nn}$(特征值的和等于矩阵的迹)。 + +**证明** +设特征多项式为 $f_A(\lambda) = |\lambda E - A|$。 +由于 $\lambda_1, \lambda_2, \dots, \lambda_n$ 是 $f_A(\lambda) = 0$ 的根,故有 +$$ +f_A(\lambda) = (\lambda - \lambda_1)(\lambda - \lambda_2) \cdots (\lambda - \lambda_n). \tag{1} +$$ + +将 $\lambda = 0$ 代入 (1) 式,得 +$$ +| -A | = (-1)^n |A| = (-1)^n \lambda_1 \lambda_2 \cdots \lambda_n, +$$ +因此 $\lambda_1 \lambda_2 \cdots \lambda_n = |A|$。 + +另一方面,将 $f_A(\lambda)$ 按行列式展开,其 $\lambda^{n-1}$ 项仅出现在主对角线上元素的乘积 $(\lambda - a_{11})(\lambda - a_{22}) \cdots (\lambda - a_{nn})$ 中,故 $\lambda^{n-1}$ 的系数为 $-(a_{11} + a_{22} + \cdots + a_{nn})$。而在 (1) 式中,$\lambda^{n-1}$ 的系数为 $-(\lambda_1 + \lambda_2 + \cdots + \lambda_n)$。比较系数即得 +$$ +\lambda_1 + \lambda_2 + \cdots + \lambda_n = a_{11} + a_{22} + \cdots + a_{nn}. +$$ + +**推论** +方阵 $A$ 可逆的充要条件是 $A$ 的所有特征值均不为零。 + +#### 迹、代数重数与几何重数 + +**定义 4.3(迹)** +设 $A = [a_{ij}] \in \mathbb{C}^{n \times n}$,则称 $a_{11} + a_{22} + \cdots + a_{nn}$ 为 $A$ 的**迹**,记作 $\operatorname{tr}(A)$。由定理 4.1 知,$\operatorname{tr}(A)$ 等于 $A$ 的所有特征值之和。 + +**定义 4.4(代数重数)** +设 $A$ 为 $n$ 阶方阵,其特征多项式可分解为 +$$ +|\lambda E - A| = (\lambda - \lambda_1)^{r_1} (\lambda - \lambda_2)^{r_2} \cdots (\lambda - \lambda_s)^{r_s}, +$$ +其中 $\lambda_1, \lambda_2, \dots, \lambda_s$ 是互不相同的特征值,且 $r_1 + r_2 + \cdots + r_s = n$。则称 $r_i$ 为特征值 $\lambda_i$ 的**代数重数**。 + +**定义 4.5(几何重数)** +设 $\lambda_i$ 是方阵 $A$ 的特征值,则称特征子空间 +$$ +V_{\lambda_i} = \{ x \mid (A - \lambda_i E) x = 0 \} +$$ +的维数 $\dim V_{\lambda_i}$ 为 $\lambda_i$ 的**几何重数**,即齐次线性方程组 $(A - \lambda_i E)x = 0$ 的基础解系所含向量的个数。 + +**定理 4.2(几何重数不超过代数重数)** +设 $\lambda_k$ 是方阵 $A$ 的特征值,其代数重数为 $r_k$,几何重数为 $d_k$,则 +$$ +d_k \leq r_k, \quad k = 1, 2, \dots, s. +$$ +即属于特征值 $\lambda_k$ 的线性无关的特征向量的个数不超过其代数重数。 + + + +#### 特征值与矩阵运算的关系 + +**例 4.5** +设 $A$ 为 $n$ 阶方阵,$\lambda$ 是 $A$ 的一个特征值,$\xi$ 是对应的特征向量(即 $A\xi = \lambda\xi$,$\xi \neq 0$)。则: + +1. 对于任意常数 $k$,$k\lambda$ 是矩阵 $kA$ 的特征值,且 $\xi$ 仍是 $kA$ 对应于 $k\lambda$ 的特征向量。 +2. 对于任意正整数 $l$($l \geq 1$),$\lambda^l$ 是矩阵 $A^l$ 的特征值,且 $\xi$ 仍是 $A^l$ 对应于 $\lambda^l$ 的特征向量。 +3. 对于矩阵多项式 + $$ + g(A) = a_k A^k + a_{k-1} A^{k-1} + \cdots + a_1 A + a_0 E, + $$ + 数 + $$ + g(\lambda) = a_k \lambda^k + a_{k-1} \lambda^{k-1} + \cdots + a_1 \lambda + a_0 + $$ + 是矩阵 $g(A)$ 的特征值,且 $\xi$ 仍是 $g(A)$ 对应于 $g(\lambda)$ 的特征向量。 + +**证明** +1. 由 $A\xi = \lambda\xi$,两边乘以 $k$ 得 $(kA)\xi = (k\lambda)\xi$,故结论成立。 +2. 对 $l$ 用数学归纳法。当 $l=1$ 时显然。假设 $A^{l-1}\xi = \lambda^{l-1}\xi$,则 + $$ + A^l \xi = A(A^{l-1}\xi) = A(\lambda^{l-1}\xi) = \lambda^{l-1} A\xi = \lambda^{l-1} \cdot \lambda \xi = \lambda^l \xi. + $$ + 故结论对任意正整数 $l$ 成立。 +3. 利用 (2) 的结论, + $$ + \begin{aligned} + g(A)\xi &= (a_k A^k + a_{k-1} A^{k-1} + \cdots + a_1 A + a_0 E)\xi \\ + &= a_k A^k\xi + a_{k-1} A^{k-1}\xi + \cdots + a_1 A\xi + a_0 E\xi \\ + &= a_k \lambda^k \xi + a_{k-1} \lambda^{k-1} \xi + \cdots + a_1 \lambda \xi + a_0 \xi \\ + &= (a_k \lambda^k + a_{k-1} \lambda^{k-1} + \cdots + a_1 \lambda + a_0) \xi \\ + &= g(\lambda) \xi. + \end{aligned} + $$ + 因此 $g(\lambda)$ 是 $g(A)$ 的特征值,$\xi$ 为对应的特征向量。 + +#### 不同特征值的特征向量线性无关 + +**定理 4.3** +设 $A$ 为 $n$ 阶方阵,$\lambda_1, \lambda_2, \dots, \lambda_s$ 是 $A$ 的 $s$ 个互不相同的特征值,$\xi_1, \xi_2, \dots, \xi_s$ 分别是与之对应的特征向量(即 $A\xi_i = \lambda_i \xi_i,\ i=1,2,\dots,s$),则向量组 $\xi_1, \xi_2, \dots, \xi_s$ 线性无关。 + +**证明(数学归纳法)** +**归纳基础**:当 $s=1$ 时,$\xi_1 \neq 0$,故线性无关。 + +**归纳假设**:假设对于 $s-1$ 个互不相同的特征值,对应的特征向量线性无关。 + +**归纳步骤**:考虑 $s$ 个互不相同的特征值 $\lambda_1, \dots, \lambda_s$ 及对应的特征向量 $\xi_1, \dots, \xi_s$。设有一组数 $k_1, \dots, k_s$ 使得 +$$ +k_1 \xi_1 + k_2 \xi_2 + \cdots + k_s \xi_s = 0. \tag{1} +$$ + +用矩阵 $A$ 左乘 (1) 式,并利用 $A\xi_i = \lambda_i \xi_i$,得 +$$ +k_1 \lambda_1 \xi_1 + k_2 \lambda_2 \xi_2 + \cdots + k_s \lambda_s \xi_s = 0. \tag{2} +$$ + +将 (1) 式乘以 $\lambda_s$,再减去 (2) 式,得 +$$ +k_1 (\lambda_s - \lambda_1) \xi_1 + k_2 (\lambda_s - \lambda_2) \xi_2 + \cdots + k_{s-1} (\lambda_s - \lambda_{s-1}) \xi_{s-1} = 0. +$$ + +由归纳假设,$\xi_1, \dots, \xi_{s-1}$ 线性无关,故 +$$ +k_i (\lambda_s - \lambda_i) = 0, \quad i = 1, 2, \dots, s-1. +$$ +因为特征值互不相同,$\lambda_s - \lambda_i \neq 0$,所以 $k_i = 0\ (i=1,\dots,s-1)$。代入 (1) 式得 $k_s \xi_s = 0$,而 $\xi_s \neq 0$,故 $k_s = 0$。因此所有系数均为零,向量组 $\xi_1, \dots, \xi_s$ 线性无关。 + +--- + +### 4.1.3 示例 + +#### 例 4.3 求矩阵 $B$ 的特征值与特征向量 + +设 +$$ +B = \begin{bmatrix} +-3 & 1 & -1 \\ +-7 & 5 & -1 \\ +-6 & 6 & -2 +\end{bmatrix}. +$$ + +**解** +计算特征多项式: +$$ +\begin{aligned} +f_B(\lambda) &= |\lambda E - B| = +\begin{vmatrix} +\lambda+3 & -1 & 1 \\ +7 & \lambda-5 & 1 \\ +6 & -6 & \lambda+2 +\end{vmatrix} \\[6pt] +&= (\lambda+3) \begin{vmatrix} \lambda-5 & 1 \\ -6 & \lambda+2 \end{vmatrix} +- (-1) \begin{vmatrix} 7 & 1 \\ 6 & \lambda+2 \end{vmatrix} ++ 1 \begin{vmatrix} 7 & \lambda-5 \\ 6 & -6 \end{vmatrix} \\[6pt] +&= (\lambda+3)\big[(\lambda-5)(\lambda+2) + 6\big] + \big[7(\lambda+2) - 6\big] + \big[7\cdot(-6) - 6(\lambda-5)\big] \\[6pt] +&= (\lambda+3)(\lambda^2 - 3\lambda -4) + (7\lambda+8) + (-12 - 6\lambda) \\[6pt] +&= (\lambda-4)\big[(\lambda+3)(\lambda+1) + 1\big] \\[6pt] +&= (\lambda-4)(\lambda^2 + 4\lambda + 4) \\[6pt] +&= (\lambda-4)(\lambda+2)^2. +\end{aligned} +$$ + +故特征方程为 $(\lambda-4)(\lambda+2)^2 = 0$,得特征值: +$$ +\lambda_1 = 4,\quad \lambda_2 = \lambda_3 = -2. +$$ + +**对于 $\lambda_1 = 4$**,解方程组 $(4E - B)x = 0$: +$$ +4E - B = \begin{bmatrix} +7 & -1 & 1 \\ +7 & -1 & 1 \\ +6 & -6 & 6 +\end{bmatrix} +\stackrel{\text{行变换}}{\longrightarrow} +\begin{bmatrix} +1 & 0 & 0 \\ +0 & -1 & 1 \\ +0 & 0 & 0 +\end{bmatrix}. +$$ +得基础解系: +$$ +\xi_1 = \begin{bmatrix} 0 \\ 1 \\ 1 \end{bmatrix}. +$$ +因此对应于 $\lambda_1 = 4$ 的全部特征向量为 $k_1\xi_1$($k_1 \neq 0$)。 + +**对于 $\lambda_2 = \lambda_3 = -2$**,解方程组 $(-2E - B)x = 0$: +$$ +-2E - B = \begin{bmatrix} +1 & -1 & 1 \\ +7 & -7 & 1 \\ +6 & -6 & 0 +\end{bmatrix} +\stackrel{\text{行变换}}{\longrightarrow} +\begin{bmatrix} +1 & -1 & 0 \\ +0 & 0 & 1 \\ +0 & 0 & 0 +\end{bmatrix}. +$$ +同解方程组为 +$$ +\begin{cases} +x_1 - x_2 = 0, \\ +x_3 = 0. +\end{cases} +$$ +取自由未知量 $x_2 = 1$,得基础解系: +$$ +\eta = \begin{bmatrix} 1 \\ 1 \\ 0 \end{bmatrix}. +$$ +因此对应于二重特征值 $-2$ 的全部特征向量为 $k\eta$($k \neq 0$)。 + +--- + +### 例 4.4(幂等矩阵的特征值) + +设 $A$ 为 $n$ 阶方阵,且满足 $A^2 = A$(即 $A$ 是幂等矩阵)。证明:$A$ 的特征值只能是 $0$ 或 $1$。 + +#### 证明 + +设 $\lambda$ 是 $A$ 的任意一个特征值,$\xi$ 是对应的特征向量($\xi \neq 0$),则有 +$$ +A\xi = \lambda \xi. +$$ + +在等式两边左乘矩阵 $A$,得 +$$ +A^2\xi = A(\lambda \xi) = \lambda A\xi = \lambda^2 \xi. +$$ + +由于 $A^2 = A$,故 $A^2\xi = A\xi = \lambda \xi$。因此 +$$ +\lambda^2 \xi = \lambda \xi \quad \Rightarrow \quad (\lambda^2 - \lambda)\xi = 0. +$$ + +因为 $\xi \neq 0$,所以 $\lambda^2 - \lambda = 0$,即 $\lambda(\lambda - 1) = 0$。解得 $\lambda = 0$ 或 $\lambda = 1$。 + +因此,幂等矩阵 $A$ 的特征值只能是 $0$ 或 $1$。 + +--- +