diff --git a/编写小组/讲义/线性方程组的解与秩的不等式(解析版).md b/编写小组/讲义/线性方程组的解与秩的不等式(解析版).md index d5e4d4f..3cefce7 100644 --- a/编写小组/讲义/线性方程组的解与秩的不等式(解析版).md +++ b/编写小组/讲义/线性方程组的解与秩的不等式(解析版).md @@ -15,6 +15,11 @@ tags: 3. 有无穷多解的充要条件是 $\text{rank}A = \text{rank}[A\ \ b] < n$。 注:上述定理也说明非齐次线性方程组有解的充要条件是 $\text{rank}A = \text{rank}[A\ \ b]$。 +怎么理解: +1. 从线性方程组的角度,如果加上一列 $b$ 后的秩变大了,那么化为最简行阶梯型后下面一定多出来一行 $0=$某个常数 ,则必然无解。 +2. 秩等于 $n$ 就是有 $n$ 个无关的方程,则经过消元法后可以解出唯一解。 +3. 秩小于$n$ 就是方程不足 $n$ 个,消元消不完,也能解释为啥秩跟解空间维数的和为 $n$ + 把以上结论应用到齐次线性方程组,可得 推论 齐次线性方程组 $A_{m\times n}x=0$ 有非零解(无穷多解)的充要条件是 $\text{rank}A < n$,即系数矩阵的秩小于未知数个数。 @@ -248,6 +253,96 @@ $$ 2)也可以从初等变换的角度来理解,方程$\boldsymbol{A}\boldsymbol{x}=\boldsymbol{\beta_1}$有解说明$\boldsymbol{\beta_1}$可以用$\boldsymbol{A}$的列向量线性表示,从而$[\boldsymbol{A\ \beta_1}]$可以通过初等列变换变成$[\boldsymbol{A\ O}]$,故$\mathrm{rank}\boldsymbol{A}=\mathrm{rank}[\boldsymbol{A\ \beta_1}]$;同理可以得出关于$\boldsymbol{\beta_2}$的结论。 3)同样,怎么直观地理解?我们一样用信息量的观点去看。方程$\boldsymbol{A}\boldsymbol{x}=\boldsymbol{\beta_1}$有解,意味着$\boldsymbol{A}$中包含了$\boldsymbol{\beta_1}$中的所有信息,同理,$\boldsymbol{A}$中也包含了$\boldsymbol{\beta_2}$中的所有信息,这就意味着矩阵$[\boldsymbol{A\ \beta_1\ \beta_2}]$中所有的信息其实只需要用$\boldsymbol{A}$就可以表示,故$\mathrm{rank}\boldsymbol{A}=\mathrm{rank}[\boldsymbol{A\ \beta_1\ \beta_2}]$,反过来也是一样的。这就说明D是正确的。 +# 矩阵秩与线性方程组解的关系图解说明 + +--- + +## 概念回顾 + +- **rank[A]** 代表矩阵$A$的秩。 +- 秩的定义:矩阵列向量组中**极大线性无关组所含列向量的个数**。 +- 可以用“圆”或“空间”来表示矩阵列向量组张成的向量空间。 + +--- + +## 图解说明 + +假设 +$$ +A = [\alpha_1, \alpha_2, \alpha_3] +$$ +是$m \times 3$矩阵, +$$ +\beta_1, \beta_2 +$$ +是$m$维列向量。 + +### 1. 方程组有解的条件 + +方程组 +$$ +Ax = \beta_1 \quad \text{和} \quad Ax = \beta_2 +$$ +有解 +$\Leftrightarrow$$\beta_1, \beta_2$可由$A$的列向量线性表示。 + +在几何上,这表示: + +- 设$A$的列向量张成的空间为$S_A$。 +-$\beta_1, \beta_2 \in S_A$。 +- 即$S_A$“包含”$\beta_1, \beta_2$。 + +因此,$S_A$这个“圆”应当能够**覆盖**$\beta_1$和$\beta_2$。 + +--- + +### 2. 秩等价条件 + +已知: +$$ +\operatorname{rank}[A] = \operatorname{rank}[A \quad \beta_1 \quad \beta_2] +$$ +表示: +- 矩阵$A$的秩与增广矩阵$[A \mid \beta_1 \mid \beta_2]$的秩相等。 +- 这意味着$\beta_1, \beta_2$并没有“扩大”$A$的列空间。 + +因此: +$$ +\operatorname{rank}[A] = \operatorname{rank}[A \quad \beta_1 \quad \beta_2] +\quad\Leftrightarrow\quad +\beta_1, \beta_2 \in S_A +$$ +即$Ax = \beta_1$和$Ax = \beta_2$有解。 + +--- + +### 3. 等价写法 + +把$\beta_1, \beta_2$放在$A$的右侧构成一个更大的矩阵: +$$ +[A \quad \beta_1 \quad \beta_2] +$$ +其秩与$A$相同,说明: +1. 空间$S_{[A \ \beta_1 \ \beta_2]}$与$S_A$相同。 +2. 从初等行变换角度看:在行阶梯形中,$\beta_1, \beta_2$对应的列会被$A$的列线性表示,从而可化为零列(在解方程时体现为消去)。 +3. 存在$x_1, x_2$使得: + $$ + A(-x_1) = \beta_1, \quad A(-x_2) = \beta_2 + $$ + 这样在增广矩阵中可以通过列操作消去$\beta_1, \beta_2$,使其变为零列。 + +--- + +## 总结 + +- 秩相等 ⇔ 列空间相同 ⇔ 方程组有解。 +- 图示法:把$A$的列空间画成一个圆,$\beta_1, \beta_2$若落在圆内,则方程有解。 +- 矩阵的秩是判断线性方程组解的存在性的核心工具。 + +--- + +**注**:这里的“圆”是比喻,实际为**线性子空间**。 + # 秩的不等式 ### 1. 和的秩不超过秩的和 @@ -260,7 +355,7 @@ $$ \operatorname{rank}(A+B) \leq \operatorname{rank} A + \operatorname{rank} B $ 设 $A_{m \times n}, B_{n \times k}$,则 $$ \operatorname{rank}(AB) \leq \min\{\operatorname{rank} A, \operatorname{rank} B\} $$ -### 3. 重要不等式 +### 3. Sylvester(西尔维斯特)不等式 设 $A_{m \times n}, B_{n \times k}$,则 $$ \operatorname{rank}(AB) \geq \operatorname{rank} A + \operatorname{rank} B - n $$ @@ -311,6 +406,188 @@ B & B \end{bmatrix} \geq \text{rank } (A + B) $$ +注:(2)与(4)结合即第一个不等式的证明方法 + +> [!note] 证明1: +$$\operatorname{rank}(AB) \leq \min\{\operatorname{rank}(A), \operatorname{rank}(B)\}$$ + +--- + +### 证明思路 +设 +$$ +A \in \mathbb{R}^{m \times n}, \quad B \in \mathbb{R}^{n \times p}, \quad C = AB \in \mathbb{R}^{m \times p}. +$$ + +--- + +#### 1. 先证$\operatorname{rank}(AB) \leq \operatorname{rank}(A)$ + +- 考虑$C$的列向量: + 设$B = [b_1, b_2, \dots, b_p]$,则 + $$ + C = [A b_1, A b_2, \dots, A b_p]. + $$ + 因此$C$的每一列都是$A$的列向量的线性组合。 +- 所以$C$的列空间是$A$的列空间的子空间,故 + $$ + \operatorname{rank}(C) \leq \operatorname{rank}(A)。 + $$ + +--- + +#### 2. 再证$\operatorname{rank}(AB) \leq \operatorname{rank}(B)$ + +- 考虑$C$的行向量: + 设$A = \begin{bmatrix} a_1^T \\ a_2^T \\ \vdots \\ a_m^T \end{bmatrix}$,则 + $$ + C = \begin{bmatrix} a_1^T B \\ a_2^T B \\ \vdots \\ a_m^T B \end{bmatrix}. + $$ + 因此$C$的每一行都是$B$的行向量的线性组合。 +- 所以$C$的行空间是$B$的行空间的子空间,故 + $$\operatorname{rank}(C) \leq \operatorname{rank}(B)$$ + +--- + +#### 3. 综合 +由 1 和 2 得 +$$ +\operatorname{rank}(AB) \leq \operatorname{rank}(A) \quad \text{且} \quad \operatorname{rank}(AB) \leq \operatorname{rank}(B), +$$ +即 +$$ +\operatorname{rank}(AB) \leq \min\{\operatorname{rank}(A), \operatorname{rank}(B)\}. +$$ + +--- + +**证毕。** + +> [!note] 证明2 +> 证明 Sylvester 秩不等式: +$$\operatorname{rank}(AB) \ge \operatorname{rank}(A) + \operatorname{rank}(B) - n$$ +其中 +$A \in \mathbb{R}^{m \times n}, \; B \in \mathbb{R}^{n \times p}, \; AB \in \mathbb{R}^{m \times p}$。 + +--- + +### 证明思路 +设: +-$\operatorname{rank}(A) = r$ +-$\operatorname{rank}(B) = s$ +-$n$是矩阵乘法的中间维度,即$A$的列数、$B$的行数。 + +--- + +#### 1. 利用分块矩阵构造 +构造如下分块矩阵: +$$ +M = \begin{bmatrix} +A & O \\ +I_n & B +\end{bmatrix} +\in \mathbb{R}^{(m+n) \times (n+p)} +$$ +其中$I_n$是$n \times n$单位矩阵,$O$是零矩阵。 + +--- + +#### 2. 对$M$进行初等变换 +从$M$的第二块行减去第一块行左乘某个矩阵(这里相当于对$M$做列初等变换),实际上我们可以对$M$做以下变换: +$$ +\begin{bmatrix} +A & O \\ +I_n & B +\end{bmatrix} +\xrightarrow{\text{右乘 } \begin{bmatrix} I_n & -B \\ O & I_p \end{bmatrix}} +\begin{bmatrix} +A & -AB \\ +I_n & O +\end{bmatrix} +$$ +初等变换不改变矩阵的秩,所以: +$$ +\operatorname{rank}(M) = \operatorname{rank}\begin{bmatrix} +A & -AB \\ +I_n & O +\end{bmatrix} +$$ + +--- + +#### 3. 估计$\operatorname{rank}(M)$ +另一方面,由分块矩阵的秩不等式: +$$ +\operatorname{rank}(M) \ge \operatorname{rank}(A) + \operatorname{rank}(B) +$$ +这是因为$M$左上块为$A$,右下块为$B$,中间有单位矩阵,所以$A$和$B$的秩可以同时取到。 + +更严格地,我们可以直接写: +$$ +\operatorname{rank}(M) \ge \operatorname{rank}\begin{bmatrix} +A \\ +I_n +\end{bmatrix} + \operatorname{rank}\begin{bmatrix} +I_n & B +\end{bmatrix} - n +$$ +但更简单的常用方法是利用: +$$ +\operatorname{rank}\begin{bmatrix} +A & O \\ +I_n & B +\end{bmatrix} \ge \operatorname{rank}(A) + \operatorname{rank}(B) +$$ +因为$I_n$的存在使得两个子块的秩可以同时保持。 + +--- + +#### 4. 从变换后的矩阵得到下界 +观察变换后的矩阵: +$$ +\operatorname{rank}\begin{bmatrix} +A & -AB \\ +I_n & O +\end{bmatrix} +\ge \operatorname{rank}\begin{bmatrix} +I_n & O +\end{bmatrix} + \operatorname{rank}([-AB]) +$$ +实际上更直接的方法是注意到: +$$ +\operatorname{rank}\begin{bmatrix} +A & -AB \\ +I_n & O +\end{bmatrix} += \operatorname{rank}\begin{bmatrix} +O & -AB \\ +I_n & O +\end{bmatrix} \quad (\text{列变换}) +$$ +即: +$$ += \operatorname{rank}\begin{bmatrix} +I_n & O \\ +O & AB +\end{bmatrix} = \operatorname{rank}(I_n) + \operatorname{rank}(AB) = n + \operatorname{rank}(AB) +$$ + +--- + +#### 5. 联立 +由初等变换保秩,得: +$$ +n + \operatorname{rank}(AB) = \operatorname{rank}(M) \ge \operatorname{rank}(A) + \operatorname{rank}(B) +$$ +整理得: +$$ +\operatorname{rank}(AB) \ge \operatorname{rank}(A) + \operatorname{rank}(B) - n +$$ + +--- + +## 重点思路 + >[!information] 思路1 >通过矩阵的秩的不等式,最大限度限制所求的表达式的取值范围,或者将其**限制到一个具体的值**. >在希望求一个矩阵的秩的确切值时,也可以考虑用不等式关系来“夹逼”,常见的不等式: @@ -322,4 +599,53 @@ $$ > [!note] 思路2 > 在遇到诸如 $AB=O$ 的情况,务必要想到$\mathrm{rank}\boldsymbol{A}+\mathrm{rank}\boldsymbol{B}-n\le\mathrm{rank}(\boldsymbol{AB}) \Rightarrow \mathrm{rank}\boldsymbol{A}+\mathrm{rank}\boldsymbol{B}\le n$ +> [!example] 例1 +> 设 $A$ 是 $m\times n$ 实矩阵, $\beta \neq 0$ 是 $m$ 维实列向量,证明: +> (1) $\mathrm{rank}A=\mathrm{rank}(A^\mathrm{T}A)$ . +> (2) 线性方程组 $A^\mathrm{T}Ax = A^\mathrm{T}\beta$ 有解.(这一问用到这个方法) + +解析:证明如下: +>(1)(10分) +> 对于方程组$Ax=0$ (a)和 $A^\mathrm{T}Ax=0$ (b),b的解空间一定包含a的解空间(5分); +>而方程b两边同时乘以$x^\mathrm{T}$,得 $x^\mathrm{T}A^\mathrm{T}Ax=0$ ,即 $(x^\mathrm{T}A^\mathrm{T})(Ax)=0 \to Ax=0$, +>所以a的解空间包含b的解空间(5分), +>所以a,b同解,所以$\mathrm{rank}A=\mathrm{rank}{A^\mathrm{T}A}$ +>(2) (10分) +>$A^\mathrm{T}Ax=A^\mathrm{T}\beta \iff \mathrm{rank}(A^\mathrm{T}A)=\mathrm{rank}(\begin{bmatrix}A^\mathrm{T}A&A^\mathrm{T}\beta\end{bmatrix})$ +>而由(1)的结论得等式左边 $\mathrm{rank}(A^\mathrm{T}A)=\mathrm{rank}A$; +>等式右边 $\mathrm{rank}(\begin{bmatrix}A^\mathrm{T}A&A^\mathrm{T}\beta\end{bmatrix})\ge \mathrm{rank}A^\mathrm{T}A=\mathrm{rank}A$ (5分) +>又$\mathrm{rank}(A^\mathrm{T}\begin{bmatrix}A&\beta\end{bmatrix})\le \min{(\mathrm{rank}A^\mathrm{T},\ \mathrm{rank}\begin{bmatrix}A&\beta\end{bmatrix})}=\mathrm{rank}A$ (5分) +>所以$\mathrm{rank}(\begin{bmatrix}A^\mathrm{T}A&A^\mathrm{T}\beta\end{bmatrix})=\mathrm{rank}A$ +>故 $\mathrm{rank}(A^\mathrm{T}A)=\mathrm{rank}(\begin{bmatrix}A^\mathrm{T}A&A^\mathrm{T}\beta\end{bmatrix})$ 得证. + +>[!example] 例2 +>已知$A, B, C, D$都是 4 阶非零矩阵,且$ABCD = O$,如果$|BC| \neq 0$,记$$r(A) + r(B) + r(C) + r(D) = r$$ +>则$r$的最大值是( )。 +>(A) 11 +>(B) 12 +>(C) 13 +>(D) 14 + +**解析思路**: +- 由$|BC| \neq 0$知$B, C$均可逆。 +- 由$ABCD = O$,故$r(AB) + r(CD) \le 4$,$r(A) + r(D) \le 4$ +- 又$B, C$满秩,即$r(B) = r(C) = 4$。 +- 于是$r = r(A) + r(B) + r(C) + r(D) \le 4 + 4 + 4 = 12$。 +- 存在构造使等号成立,故最大值为$12$。 +- 例如$$A = +\begin{pmatrix} +1 & 0 & 0 & 0 \\ +0 & 1 & 0 & 0 \\ +0 & 0 & 0 & 0 \\ +0 & 0 & 0 & 0 +\end{pmatrix}, +\quad +D = +\begin{pmatrix} +0 & 0 & 0 & 0 \\ +0 & 0 & 0 & 0 \\ +1 & 0 & 0 & 0 \\ +0 & 1 & 0 & 0 +\end{pmatrix}$$ +**答案**: (B) 12