修改了文件:

pull/6/head
郑哲航 2 months ago
parent 4f50754479
commit a99454a740

@ -0,0 +1,297 @@
# 第四章 方阵的相似化问题
## 4.1 特征值与特征向量
### 4.1.1 基本概念与求法
**定义 4.1**
设 $n$ 阶方阵 $A = [a_{ij}] \in \mathbb{C}^{n \times n}$,若存在数 $\lambda$ 和非零向量 $\xi$ 使得
$$
A\xi = \lambda \xi,
$$
则称 $\lambda$ 是矩阵 $A$ 的一个**特征值**$\xi$ 是矩阵 $A$ 对应于 $\lambda$ 的一个**特征向量**。
#### 特征值与特征向量的求法
由定义可得:
$$
A\xi = \lambda \xi \quad \text{且} \quad \xi \neq 0.
$$
等价地:
$$
(\lambda E - A)\xi = 0 \quad \text{且} \quad \xi \neq 0.
$$
这表明**特征向量 $\xi$** 是齐次线性方程组 $(\lambda E - A)x = 0$ 的**非零解**。该方程组有非零解当且仅当
$$
\operatorname{rank}(\lambda E - A) < n,
$$
即 $\lambda E - A$ 是奇异矩阵(行列式为零)。
**求法步骤**
1. **求特征值**
由 $|\lambda E - A| = 0$ 解出 $\lambda$ 的所有根 $\lambda_1, \lambda_2, \dots, \lambda_n$(包括重根)。
2. **求特征向量**
对每个特征值 $\lambda_i$,代入齐次线性方程组
$$
(\lambda_i E - A)x = 0
$$
求解,所得的全部非零解即为对应于 $\lambda_i$ 的特征向量。
#### 特征多项式与特征方程
**定义 4.2**
设 $A$ 为 $n$ 阶方阵,$\lambda$ 是一个变量,则矩阵 $\lambda E - A$ 称为 $A$ 的**特征矩阵**,其行列式
$$
f_A(\lambda) = |\lambda E - A|
$$
称为 $A$ 的**特征多项式**,方程 $|\lambda E - A| = 0$ 称为 $A$ 的**特征方程**。
特征方程的根就是矩阵 $A$ 的特征值。
---
### 4.1.2 特征值与特征向量的性质
#### 特征值的积与和
**定理 4.1**
设 $n$ 阶方阵 $A = [a_{ij}] \in \mathbb{C}^{n \times n}$ 的 $n$ 个特征值为 $\lambda_1, \lambda_2, \dots, \lambda_n$(重根按重数计算),则:
1. $\lambda_1 \lambda_2 \cdots \lambda_n = |A|$(特征值的积等于矩阵的行列式);
2. $\lambda_1 + \lambda_2 + \cdots + \lambda_n = a_{11} + a_{22} + \cdots + a_{nn}$(特征值的和等于矩阵的迹)。
**证明**
设特征多项式为 $f_A(\lambda) = |\lambda E - A|$。
由于 $\lambda_1, \lambda_2, \dots, \lambda_n$ 是 $f_A(\lambda) = 0$ 的根,故有
$$
f_A(\lambda) = (\lambda - \lambda_1)(\lambda - \lambda_2) \cdots (\lambda - \lambda_n). \tag{1}
$$
将 $\lambda = 0$ 代入 (1) 式,得
$$
| -A | = (-1)^n |A| = (-1)^n \lambda_1 \lambda_2 \cdots \lambda_n,
$$
因此 $\lambda_1 \lambda_2 \cdots \lambda_n = |A|$。
另一方面,将 $f_A(\lambda)$ 按行列式展开,其 $\lambda^{n-1}$ 项仅出现在主对角线上元素的乘积 $(\lambda - a_{11})(\lambda - a_{22}) \cdots (\lambda - a_{nn})$ 中,故 $\lambda^{n-1}$ 的系数为 $-(a_{11} + a_{22} + \cdots + a_{nn})$。而在 (1) 式中,$\lambda^{n-1}$ 的系数为 $-(\lambda_1 + \lambda_2 + \cdots + \lambda_n)$。比较系数即得
$$
\lambda_1 + \lambda_2 + \cdots + \lambda_n = a_{11} + a_{22} + \cdots + a_{nn}.
$$
**推论**
方阵 $A$ 可逆的充要条件是 $A$ 的所有特征值均不为零。
#### 迹、代数重数与几何重数
**定义 4.3(迹)**
设 $A = [a_{ij}] \in \mathbb{C}^{n \times n}$,则称 $a_{11} + a_{22} + \cdots + a_{nn}$ 为 $A$ 的**迹**,记作 $\operatorname{tr}(A)$。由定理 4.1 知,$\operatorname{tr}(A)$ 等于 $A$ 的所有特征值之和。
**定义 4.4(代数重数)**
设 $A$ 为 $n$ 阶方阵,其特征多项式可分解为
$$
|\lambda E - A| = (\lambda - \lambda_1)^{r_1} (\lambda - \lambda_2)^{r_2} \cdots (\lambda - \lambda_s)^{r_s},
$$
其中 $\lambda_1, \lambda_2, \dots, \lambda_s$ 是互不相同的特征值,且 $r_1 + r_2 + \cdots + r_s = n$。则称 $r_i$ 为特征值 $\lambda_i$ 的**代数重数**。
**定义 4.5(几何重数)**
设 $\lambda_i$ 是方阵 $A$ 的特征值,则称特征子空间
$$
V_{\lambda_i} = \{ x \mid (A - \lambda_i E) x = 0 \}
$$
的维数 $\dim V_{\lambda_i}$ 为 $\lambda_i$ 的**几何重数**,即齐次线性方程组 $(A - \lambda_i E)x = 0$ 的基础解系所含向量的个数。
**定理 4.2(几何重数不超过代数重数)**
设 $\lambda_k$ 是方阵 $A$ 的特征值,其代数重数为 $r_k$,几何重数为 $d_k$,则
$$
d_k \leq r_k, \quad k = 1, 2, \dots, s.
$$
即属于特征值 $\lambda_k$ 的线性无关的特征向量的个数不超过其代数重数。
#### 特征值与矩阵运算的关系
**例 4.5**
设 $A$ 为 $n$ 阶方阵,$\lambda$ 是 $A$ 的一个特征值,$\xi$ 是对应的特征向量(即 $A\xi = \lambda\xi$$\xi \neq 0$)。则:
1. 对于任意常数 $k$$k\lambda$ 是矩阵 $kA$ 的特征值,且 $\xi$ 仍是 $kA$ 对应于 $k\lambda$ 的特征向量。
2. 对于任意正整数 $l$$l \geq 1$$\lambda^l$ 是矩阵 $A^l$ 的特征值,且 $\xi$ 仍是 $A^l$ 对应于 $\lambda^l$ 的特征向量。
3. 对于矩阵多项式
$$
g(A) = a_k A^k + a_{k-1} A^{k-1} + \cdots + a_1 A + a_0 E,
$$
$$
g(\lambda) = a_k \lambda^k + a_{k-1} \lambda^{k-1} + \cdots + a_1 \lambda + a_0
$$
是矩阵 $g(A)$ 的特征值,且 $\xi$ 仍是 $g(A)$ 对应于 $g(\lambda)$ 的特征向量。
**证明**
1. 由 $A\xi = \lambda\xi$,两边乘以 $k$ 得 $(kA)\xi = (k\lambda)\xi$,故结论成立。
2. 对 $l$ 用数学归纳法。当 $l=1$ 时显然。假设 $A^{l-1}\xi = \lambda^{l-1}\xi$,则
$$
A^l \xi = A(A^{l-1}\xi) = A(\lambda^{l-1}\xi) = \lambda^{l-1} A\xi = \lambda^{l-1} \cdot \lambda \xi = \lambda^l \xi.
$$
故结论对任意正整数 $l$ 成立。
3. 利用 (2) 的结论,
$$
\begin{aligned}
g(A)\xi &= (a_k A^k + a_{k-1} A^{k-1} + \cdots + a_1 A + a_0 E)\xi \\
&= a_k A^k\xi + a_{k-1} A^{k-1}\xi + \cdots + a_1 A\xi + a_0 E\xi \\
&= a_k \lambda^k \xi + a_{k-1} \lambda^{k-1} \xi + \cdots + a_1 \lambda \xi + a_0 \xi \\
&= (a_k \lambda^k + a_{k-1} \lambda^{k-1} + \cdots + a_1 \lambda + a_0) \xi \\
&= g(\lambda) \xi.
\end{aligned}
$$
因此 $g(\lambda)$ 是 $g(A)$ 的特征值,$\xi$ 为对应的特征向量。
#### 不同特征值的特征向量线性无关
**定理 4.3**
设 $A$ 为 $n$ 阶方阵,$\lambda_1, \lambda_2, \dots, \lambda_s$ 是 $A$ 的 $s$ 个互不相同的特征值,$\xi_1, \xi_2, \dots, \xi_s$ 分别是与之对应的特征向量(即 $A\xi_i = \lambda_i \xi_i,\ i=1,2,\dots,s$),则向量组 $\xi_1, \xi_2, \dots, \xi_s$ 线性无关。
**证明(数学归纳法)**
**归纳基础**:当 $s=1$ 时,$\xi_1 \neq 0$,故线性无关。
**归纳假设**:假设对于 $s-1$ 个互不相同的特征值,对应的特征向量线性无关。
**归纳步骤**:考虑 $s$ 个互不相同的特征值 $\lambda_1, \dots, \lambda_s$ 及对应的特征向量 $\xi_1, \dots, \xi_s$。设有一组数 $k_1, \dots, k_s$ 使得
$$
k_1 \xi_1 + k_2 \xi_2 + \cdots + k_s \xi_s = 0. \tag{1}
$$
用矩阵 $A$ 左乘 (1) 式,并利用 $A\xi_i = \lambda_i \xi_i$,得
$$
k_1 \lambda_1 \xi_1 + k_2 \lambda_2 \xi_2 + \cdots + k_s \lambda_s \xi_s = 0. \tag{2}
$$
将 (1) 式乘以 $\lambda_s$,再减去 (2) 式,得
$$
k_1 (\lambda_s - \lambda_1) \xi_1 + k_2 (\lambda_s - \lambda_2) \xi_2 + \cdots + k_{s-1} (\lambda_s - \lambda_{s-1}) \xi_{s-1} = 0.
$$
由归纳假设,$\xi_1, \dots, \xi_{s-1}$ 线性无关,故
$$
k_i (\lambda_s - \lambda_i) = 0, \quad i = 1, 2, \dots, s-1.
$$
因为特征值互不相同,$\lambda_s - \lambda_i \neq 0$,所以 $k_i = 0\ (i=1,\dots,s-1)$。代入 (1) 式得 $k_s \xi_s = 0$,而 $\xi_s \neq 0$,故 $k_s = 0$。因此所有系数均为零,向量组 $\xi_1, \dots, \xi_s$ 线性无关。
---
### 4.1.3 示例
#### 例 4.3 求矩阵 $B$ 的特征值与特征向量
$$
B = \begin{bmatrix}
-3 & 1 & -1 \\
-7 & 5 & -1 \\
-6 & 6 & -2
\end{bmatrix}.
$$
**解**
计算特征多项式:
$$
\begin{aligned}
f_B(\lambda) &= |\lambda E - B| =
\begin{vmatrix}
\lambda+3 & -1 & 1 \\
7 & \lambda-5 & 1 \\
6 & -6 & \lambda+2
\end{vmatrix} \\[6pt]
&= (\lambda+3) \begin{vmatrix} \lambda-5 & 1 \\ -6 & \lambda+2 \end{vmatrix}
- (-1) \begin{vmatrix} 7 & 1 \\ 6 & \lambda+2 \end{vmatrix}
+ 1 \begin{vmatrix} 7 & \lambda-5 \\ 6 & -6 \end{vmatrix} \\[6pt]
&= (\lambda+3)\big[(\lambda-5)(\lambda+2) + 6\big] + \big[7(\lambda+2) - 6\big] + \big[7\cdot(-6) - 6(\lambda-5)\big] \\[6pt]
&= (\lambda+3)(\lambda^2 - 3\lambda -4) + (7\lambda+8) + (-12 - 6\lambda) \\[6pt]
&= (\lambda-4)\big[(\lambda+3)(\lambda+1) + 1\big] \\[6pt]
&= (\lambda-4)(\lambda^2 + 4\lambda + 4) \\[6pt]
&= (\lambda-4)(\lambda+2)^2.
\end{aligned}
$$
故特征方程为 $(\lambda-4)(\lambda+2)^2 = 0$,得特征值:
$$
\lambda_1 = 4,\quad \lambda_2 = \lambda_3 = -2.
$$
**对于 $\lambda_1 = 4$**,解方程组 $(4E - B)x = 0$
$$
4E - B = \begin{bmatrix}
7 & -1 & 1 \\
7 & -1 & 1 \\
6 & -6 & 6
\end{bmatrix}
\stackrel{\text{行变换}}{\longrightarrow}
\begin{bmatrix}
1 & 0 & 0 \\
0 & -1 & 1 \\
0 & 0 & 0
\end{bmatrix}.
$$
得基础解系:
$$
\xi_1 = \begin{bmatrix} 0 \\ 1 \\ 1 \end{bmatrix}.
$$
因此对应于 $\lambda_1 = 4$ 的全部特征向量为 $k_1\xi_1$$k_1 \neq 0$)。
**对于 $\lambda_2 = \lambda_3 = -2$**,解方程组 $(-2E - B)x = 0$
$$
-2E - B = \begin{bmatrix}
1 & -1 & 1 \\
7 & -7 & 1 \\
6 & -6 & 0
\end{bmatrix}
\stackrel{\text{行变换}}{\longrightarrow}
\begin{bmatrix}
1 & -1 & 0 \\
0 & 0 & 1 \\
0 & 0 & 0
\end{bmatrix}.
$$
同解方程组为
$$
\begin{cases}
x_1 - x_2 = 0, \\
x_3 = 0.
\end{cases}
$$
取自由未知量 $x_2 = 1$,得基础解系:
$$
\eta = \begin{bmatrix} 1 \\ 1 \\ 0 \end{bmatrix}.
$$
因此对应于二重特征值 $-2$ 的全部特征向量为 $k\eta$$k \neq 0$)。
---
### 例 4.4(幂等矩阵的特征值)
设 $A$ 为 $n$ 阶方阵,且满足 $A^2 = A$(即 $A$ 是幂等矩阵)。证明:$A$ 的特征值只能是 $0$ 或 $1$。
#### 证明
设 $\lambda$ 是 $A$ 的任意一个特征值,$\xi$ 是对应的特征向量($\xi \neq 0$),则有
$$
A\xi = \lambda \xi.
$$
在等式两边左乘矩阵 $A$,得
$$
A^2\xi = A(\lambda \xi) = \lambda A\xi = \lambda^2 \xi.
$$
由于 $A^2 = A$,故 $A^2\xi = A\xi = \lambda \xi$。因此
$$
\lambda^2 \xi = \lambda \xi \quad \Rightarrow \quad (\lambda^2 - \lambda)\xi = 0.
$$
因为 $\xi \neq 0$,所以 $\lambda^2 - \lambda = 0$,即 $\lambda(\lambda - 1) = 0$。解得 $\lambda = 0$ 或 $\lambda = 1$。
因此,幂等矩阵 $A$ 的特征值只能是 $0$ 或 $1$。
---
Loading…
Cancel
Save