|
|
|
|
@ -15,6 +15,11 @@ tags:
|
|
|
|
|
3. 有无穷多解的充要条件是 $\text{rank}A = \text{rank}[A\ \ b] < n$。
|
|
|
|
|
注:上述定理也说明非齐次线性方程组有解的充要条件是 $\text{rank}A = \text{rank}[A\ \ b]$。
|
|
|
|
|
|
|
|
|
|
怎么理解:
|
|
|
|
|
1. 从线性方程组的角度,如果加上一列 $b$ 后的秩变大了,那么化为最简行阶梯型后下面一定多出来一行 $0=$某个常数 ,则必然无解。
|
|
|
|
|
2. 秩等于 $n$ 就是有 $n$ 个无关的方程,则经过消元法后可以解出唯一解。
|
|
|
|
|
3. 秩小于$n$ 就是方程不足 $n$ 个,消元消不完,也能解释为啥秩跟解空间维数的和为 $n$
|
|
|
|
|
|
|
|
|
|
把以上结论应用到齐次线性方程组,可得
|
|
|
|
|
推论 齐次线性方程组 $A_{m\times n}x=0$ 有非零解(无穷多解)的充要条件是 $\text{rank}A < n$,即系数矩阵的秩小于未知数个数。
|
|
|
|
|
|
|
|
|
|
@ -248,6 +253,96 @@ $$
|
|
|
|
|
2)也可以从初等变换的角度来理解,方程$\boldsymbol{A}\boldsymbol{x}=\boldsymbol{\beta_1}$有解说明$\boldsymbol{\beta_1}$可以用$\boldsymbol{A}$的列向量线性表示,从而$[\boldsymbol{A\ \beta_1}]$可以通过初等列变换变成$[\boldsymbol{A\ O}]$,故$\mathrm{rank}\boldsymbol{A}=\mathrm{rank}[\boldsymbol{A\ \beta_1}]$;同理可以得出关于$\boldsymbol{\beta_2}$的结论。
|
|
|
|
|
3)同样,怎么直观地理解?我们一样用信息量的观点去看。方程$\boldsymbol{A}\boldsymbol{x}=\boldsymbol{\beta_1}$有解,意味着$\boldsymbol{A}$中包含了$\boldsymbol{\beta_1}$中的所有信息,同理,$\boldsymbol{A}$中也包含了$\boldsymbol{\beta_2}$中的所有信息,这就意味着矩阵$[\boldsymbol{A\ \beta_1\ \beta_2}]$中所有的信息其实只需要用$\boldsymbol{A}$就可以表示,故$\mathrm{rank}\boldsymbol{A}=\mathrm{rank}[\boldsymbol{A\ \beta_1\ \beta_2}]$,反过来也是一样的。这就说明D是正确的。
|
|
|
|
|
|
|
|
|
|
# 矩阵秩与线性方程组解的关系图解说明
|
|
|
|
|
|
|
|
|
|
---
|
|
|
|
|
|
|
|
|
|
## 概念回顾
|
|
|
|
|
|
|
|
|
|
- **rank[A]** 代表矩阵$A$的秩。
|
|
|
|
|
- 秩的定义:矩阵列向量组中**极大线性无关组所含列向量的个数**。
|
|
|
|
|
- 可以用“圆”或“空间”来表示矩阵列向量组张成的向量空间。
|
|
|
|
|
|
|
|
|
|
---
|
|
|
|
|
|
|
|
|
|
## 图解说明
|
|
|
|
|
|
|
|
|
|
假设
|
|
|
|
|
$$
|
|
|
|
|
A = [\alpha_1, \alpha_2, \alpha_3]
|
|
|
|
|
$$
|
|
|
|
|
是$m \times 3$矩阵,
|
|
|
|
|
$$
|
|
|
|
|
\beta_1, \beta_2
|
|
|
|
|
$$
|
|
|
|
|
是$m$维列向量。
|
|
|
|
|
|
|
|
|
|
### 1. 方程组有解的条件
|
|
|
|
|
|
|
|
|
|
方程组
|
|
|
|
|
$$
|
|
|
|
|
Ax = \beta_1 \quad \text{和} \quad Ax = \beta_2
|
|
|
|
|
$$
|
|
|
|
|
有解
|
|
|
|
|
$\Leftrightarrow$$\beta_1, \beta_2$可由$A$的列向量线性表示。
|
|
|
|
|
|
|
|
|
|
在几何上,这表示:
|
|
|
|
|
|
|
|
|
|
- 设$A$的列向量张成的空间为$S_A$。
|
|
|
|
|
-$\beta_1, \beta_2 \in S_A$。
|
|
|
|
|
- 即$S_A$“包含”$\beta_1, \beta_2$。
|
|
|
|
|
|
|
|
|
|
因此,$S_A$这个“圆”应当能够**覆盖**$\beta_1$和$\beta_2$。
|
|
|
|
|
|
|
|
|
|
---
|
|
|
|
|
|
|
|
|
|
### 2. 秩等价条件
|
|
|
|
|
|
|
|
|
|
已知:
|
|
|
|
|
$$
|
|
|
|
|
\operatorname{rank}[A] = \operatorname{rank}[A \quad \beta_1 \quad \beta_2]
|
|
|
|
|
$$
|
|
|
|
|
表示:
|
|
|
|
|
- 矩阵$A$的秩与增广矩阵$[A \mid \beta_1 \mid \beta_2]$的秩相等。
|
|
|
|
|
- 这意味着$\beta_1, \beta_2$并没有“扩大”$A$的列空间。
|
|
|
|
|
|
|
|
|
|
因此:
|
|
|
|
|
$$
|
|
|
|
|
\operatorname{rank}[A] = \operatorname{rank}[A \quad \beta_1 \quad \beta_2]
|
|
|
|
|
\quad\Leftrightarrow\quad
|
|
|
|
|
\beta_1, \beta_2 \in S_A
|
|
|
|
|
$$
|
|
|
|
|
即$Ax = \beta_1$和$Ax = \beta_2$有解。
|
|
|
|
|
|
|
|
|
|
---
|
|
|
|
|
|
|
|
|
|
### 3. 等价写法
|
|
|
|
|
|
|
|
|
|
把$\beta_1, \beta_2$放在$A$的右侧构成一个更大的矩阵:
|
|
|
|
|
$$
|
|
|
|
|
[A \quad \beta_1 \quad \beta_2]
|
|
|
|
|
$$
|
|
|
|
|
其秩与$A$相同,说明:
|
|
|
|
|
1. 空间$S_{[A \ \beta_1 \ \beta_2]}$与$S_A$相同。
|
|
|
|
|
2. 从初等行变换角度看:在行阶梯形中,$\beta_1, \beta_2$对应的列会被$A$的列线性表示,从而可化为零列(在解方程时体现为消去)。
|
|
|
|
|
3. 存在$x_1, x_2$使得:
|
|
|
|
|
$$
|
|
|
|
|
A(-x_1) = \beta_1, \quad A(-x_2) = \beta_2
|
|
|
|
|
$$
|
|
|
|
|
这样在增广矩阵中可以通过列操作消去$\beta_1, \beta_2$,使其变为零列。
|
|
|
|
|
|
|
|
|
|
---
|
|
|
|
|
|
|
|
|
|
## 总结
|
|
|
|
|
|
|
|
|
|
- 秩相等 ⇔ 列空间相同 ⇔ 方程组有解。
|
|
|
|
|
- 图示法:把$A$的列空间画成一个圆,$\beta_1, \beta_2$若落在圆内,则方程有解。
|
|
|
|
|
- 矩阵的秩是判断线性方程组解的存在性的核心工具。
|
|
|
|
|
|
|
|
|
|
---
|
|
|
|
|
|
|
|
|
|
**注**:这里的“圆”是比喻,实际为**线性子空间**。
|
|
|
|
|
|
|
|
|
|
# 秩的不等式
|
|
|
|
|
|
|
|
|
|
### 1. 和的秩不超过秩的和
|
|
|
|
|
@ -260,7 +355,7 @@ $$ \operatorname{rank}(A+B) \leq \operatorname{rank} A + \operatorname{rank} B $
|
|
|
|
|
设 $A_{m \times n}, B_{n \times k}$,则
|
|
|
|
|
$$ \operatorname{rank}(AB) \leq \min\{\operatorname{rank} A, \operatorname{rank} B\} $$
|
|
|
|
|
|
|
|
|
|
### 3. 重要不等式
|
|
|
|
|
### 3. Sylvester(西尔维斯特)不等式
|
|
|
|
|
|
|
|
|
|
设 $A_{m \times n}, B_{n \times k}$,则
|
|
|
|
|
$$ \operatorname{rank}(AB) \geq \operatorname{rank} A + \operatorname{rank} B - n $$
|
|
|
|
|
@ -311,6 +406,188 @@ B & B
|
|
|
|
|
\end{bmatrix} \geq \text{rank } (A + B)
|
|
|
|
|
$$
|
|
|
|
|
|
|
|
|
|
注:(2)与(4)结合即第一个不等式的证明方法
|
|
|
|
|
|
|
|
|
|
> [!note] 证明1:
|
|
|
|
|
$$\operatorname{rank}(AB) \leq \min\{\operatorname{rank}(A), \operatorname{rank}(B)\}$$
|
|
|
|
|
|
|
|
|
|
---
|
|
|
|
|
|
|
|
|
|
### 证明思路
|
|
|
|
|
设
|
|
|
|
|
$$
|
|
|
|
|
A \in \mathbb{R}^{m \times n}, \quad B \in \mathbb{R}^{n \times p}, \quad C = AB \in \mathbb{R}^{m \times p}.
|
|
|
|
|
$$
|
|
|
|
|
|
|
|
|
|
---
|
|
|
|
|
|
|
|
|
|
#### 1. 先证$\operatorname{rank}(AB) \leq \operatorname{rank}(A)$
|
|
|
|
|
|
|
|
|
|
- 考虑$C$的列向量:
|
|
|
|
|
设$B = [b_1, b_2, \dots, b_p]$,则
|
|
|
|
|
$$
|
|
|
|
|
C = [A b_1, A b_2, \dots, A b_p].
|
|
|
|
|
$$
|
|
|
|
|
因此$C$的每一列都是$A$的列向量的线性组合。
|
|
|
|
|
- 所以$C$的列空间是$A$的列空间的子空间,故
|
|
|
|
|
$$
|
|
|
|
|
\operatorname{rank}(C) \leq \operatorname{rank}(A)。
|
|
|
|
|
$$
|
|
|
|
|
|
|
|
|
|
---
|
|
|
|
|
|
|
|
|
|
#### 2. 再证$\operatorname{rank}(AB) \leq \operatorname{rank}(B)$
|
|
|
|
|
|
|
|
|
|
- 考虑$C$的行向量:
|
|
|
|
|
设$A = \begin{bmatrix} a_1^T \\ a_2^T \\ \vdots \\ a_m^T \end{bmatrix}$,则
|
|
|
|
|
$$
|
|
|
|
|
C = \begin{bmatrix} a_1^T B \\ a_2^T B \\ \vdots \\ a_m^T B \end{bmatrix}.
|
|
|
|
|
$$
|
|
|
|
|
因此$C$的每一行都是$B$的行向量的线性组合。
|
|
|
|
|
- 所以$C$的行空间是$B$的行空间的子空间,故
|
|
|
|
|
$$\operatorname{rank}(C) \leq \operatorname{rank}(B)$$
|
|
|
|
|
|
|
|
|
|
---
|
|
|
|
|
|
|
|
|
|
#### 3. 综合
|
|
|
|
|
由 1 和 2 得
|
|
|
|
|
$$
|
|
|
|
|
\operatorname{rank}(AB) \leq \operatorname{rank}(A) \quad \text{且} \quad \operatorname{rank}(AB) \leq \operatorname{rank}(B),
|
|
|
|
|
$$
|
|
|
|
|
即
|
|
|
|
|
$$
|
|
|
|
|
\operatorname{rank}(AB) \leq \min\{\operatorname{rank}(A), \operatorname{rank}(B)\}.
|
|
|
|
|
$$
|
|
|
|
|
|
|
|
|
|
---
|
|
|
|
|
|
|
|
|
|
**证毕。**
|
|
|
|
|
|
|
|
|
|
> [!note] 证明2
|
|
|
|
|
> 证明 Sylvester 秩不等式:
|
|
|
|
|
$$\operatorname{rank}(AB) \ge \operatorname{rank}(A) + \operatorname{rank}(B) - n$$
|
|
|
|
|
其中
|
|
|
|
|
$A \in \mathbb{R}^{m \times n}, \; B \in \mathbb{R}^{n \times p}, \; AB \in \mathbb{R}^{m \times p}$。
|
|
|
|
|
|
|
|
|
|
---
|
|
|
|
|
|
|
|
|
|
### 证明思路
|
|
|
|
|
设:
|
|
|
|
|
-$\operatorname{rank}(A) = r$
|
|
|
|
|
-$\operatorname{rank}(B) = s$
|
|
|
|
|
-$n$是矩阵乘法的中间维度,即$A$的列数、$B$的行数。
|
|
|
|
|
|
|
|
|
|
---
|
|
|
|
|
|
|
|
|
|
#### 1. 利用分块矩阵构造
|
|
|
|
|
构造如下分块矩阵:
|
|
|
|
|
$$
|
|
|
|
|
M = \begin{bmatrix}
|
|
|
|
|
A & O \\
|
|
|
|
|
I_n & B
|
|
|
|
|
\end{bmatrix}
|
|
|
|
|
\in \mathbb{R}^{(m+n) \times (n+p)}
|
|
|
|
|
$$
|
|
|
|
|
其中$I_n$是$n \times n$单位矩阵,$O$是零矩阵。
|
|
|
|
|
|
|
|
|
|
---
|
|
|
|
|
|
|
|
|
|
#### 2. 对$M$进行初等变换
|
|
|
|
|
从$M$的第二块行减去第一块行左乘某个矩阵(这里相当于对$M$做列初等变换),实际上我们可以对$M$做以下变换:
|
|
|
|
|
$$
|
|
|
|
|
\begin{bmatrix}
|
|
|
|
|
A & O \\
|
|
|
|
|
I_n & B
|
|
|
|
|
\end{bmatrix}
|
|
|
|
|
\xrightarrow{\text{右乘 } \begin{bmatrix} I_n & -B \\ O & I_p \end{bmatrix}}
|
|
|
|
|
\begin{bmatrix}
|
|
|
|
|
A & -AB \\
|
|
|
|
|
I_n & O
|
|
|
|
|
\end{bmatrix}
|
|
|
|
|
$$
|
|
|
|
|
初等变换不改变矩阵的秩,所以:
|
|
|
|
|
$$
|
|
|
|
|
\operatorname{rank}(M) = \operatorname{rank}\begin{bmatrix}
|
|
|
|
|
A & -AB \\
|
|
|
|
|
I_n & O
|
|
|
|
|
\end{bmatrix}
|
|
|
|
|
$$
|
|
|
|
|
|
|
|
|
|
---
|
|
|
|
|
|
|
|
|
|
#### 3. 估计$\operatorname{rank}(M)$
|
|
|
|
|
另一方面,由分块矩阵的秩不等式:
|
|
|
|
|
$$
|
|
|
|
|
\operatorname{rank}(M) \ge \operatorname{rank}(A) + \operatorname{rank}(B)
|
|
|
|
|
$$
|
|
|
|
|
这是因为$M$左上块为$A$,右下块为$B$,中间有单位矩阵,所以$A$和$B$的秩可以同时取到。
|
|
|
|
|
|
|
|
|
|
更严格地,我们可以直接写:
|
|
|
|
|
$$
|
|
|
|
|
\operatorname{rank}(M) \ge \operatorname{rank}\begin{bmatrix}
|
|
|
|
|
A \\
|
|
|
|
|
I_n
|
|
|
|
|
\end{bmatrix} + \operatorname{rank}\begin{bmatrix}
|
|
|
|
|
I_n & B
|
|
|
|
|
\end{bmatrix} - n
|
|
|
|
|
$$
|
|
|
|
|
但更简单的常用方法是利用:
|
|
|
|
|
$$
|
|
|
|
|
\operatorname{rank}\begin{bmatrix}
|
|
|
|
|
A & O \\
|
|
|
|
|
I_n & B
|
|
|
|
|
\end{bmatrix} \ge \operatorname{rank}(A) + \operatorname{rank}(B)
|
|
|
|
|
$$
|
|
|
|
|
因为$I_n$的存在使得两个子块的秩可以同时保持。
|
|
|
|
|
|
|
|
|
|
---
|
|
|
|
|
|
|
|
|
|
#### 4. 从变换后的矩阵得到下界
|
|
|
|
|
观察变换后的矩阵:
|
|
|
|
|
$$
|
|
|
|
|
\operatorname{rank}\begin{bmatrix}
|
|
|
|
|
A & -AB \\
|
|
|
|
|
I_n & O
|
|
|
|
|
\end{bmatrix}
|
|
|
|
|
\ge \operatorname{rank}\begin{bmatrix}
|
|
|
|
|
I_n & O
|
|
|
|
|
\end{bmatrix} + \operatorname{rank}([-AB])
|
|
|
|
|
$$
|
|
|
|
|
实际上更直接的方法是注意到:
|
|
|
|
|
$$
|
|
|
|
|
\operatorname{rank}\begin{bmatrix}
|
|
|
|
|
A & -AB \\
|
|
|
|
|
I_n & O
|
|
|
|
|
\end{bmatrix}
|
|
|
|
|
= \operatorname{rank}\begin{bmatrix}
|
|
|
|
|
O & -AB \\
|
|
|
|
|
I_n & O
|
|
|
|
|
\end{bmatrix} \quad (\text{列变换})
|
|
|
|
|
$$
|
|
|
|
|
即:
|
|
|
|
|
$$
|
|
|
|
|
= \operatorname{rank}\begin{bmatrix}
|
|
|
|
|
I_n & O \\
|
|
|
|
|
O & AB
|
|
|
|
|
\end{bmatrix} = \operatorname{rank}(I_n) + \operatorname{rank}(AB) = n + \operatorname{rank}(AB)
|
|
|
|
|
$$
|
|
|
|
|
|
|
|
|
|
---
|
|
|
|
|
|
|
|
|
|
#### 5. 联立
|
|
|
|
|
由初等变换保秩,得:
|
|
|
|
|
$$
|
|
|
|
|
n + \operatorname{rank}(AB) = \operatorname{rank}(M) \ge \operatorname{rank}(A) + \operatorname{rank}(B)
|
|
|
|
|
$$
|
|
|
|
|
整理得:
|
|
|
|
|
$$
|
|
|
|
|
\operatorname{rank}(AB) \ge \operatorname{rank}(A) + \operatorname{rank}(B) - n
|
|
|
|
|
$$
|
|
|
|
|
|
|
|
|
|
---
|
|
|
|
|
|
|
|
|
|
## 重点思路
|
|
|
|
|
|
|
|
|
|
>[!information] 思路1
|
|
|
|
|
>通过矩阵的秩的不等式,最大限度限制所求的表达式的取值范围,或者将其**限制到一个具体的值**.
|
|
|
|
|
>在希望求一个矩阵的秩的确切值时,也可以考虑用不等式关系来“夹逼”,常见的不等式:
|
|
|
|
|
@ -322,4 +599,53 @@ $$
|
|
|
|
|
> [!note] 思路2
|
|
|
|
|
> 在遇到诸如 $AB=O$ 的情况,务必要想到$\mathrm{rank}\boldsymbol{A}+\mathrm{rank}\boldsymbol{B}-n\le\mathrm{rank}(\boldsymbol{AB}) \Rightarrow \mathrm{rank}\boldsymbol{A}+\mathrm{rank}\boldsymbol{B}\le n$
|
|
|
|
|
|
|
|
|
|
> [!example] 例1
|
|
|
|
|
> 设 $A$ 是 $m\times n$ 实矩阵, $\beta \neq 0$ 是 $m$ 维实列向量,证明:
|
|
|
|
|
> (1) $\mathrm{rank}A=\mathrm{rank}(A^\mathrm{T}A)$ .
|
|
|
|
|
> (2) 线性方程组 $A^\mathrm{T}Ax = A^\mathrm{T}\beta$ 有解.(这一问用到这个方法)
|
|
|
|
|
|
|
|
|
|
解析:证明如下:
|
|
|
|
|
>(1)(10分)
|
|
|
|
|
> 对于方程组$Ax=0$ (a)和 $A^\mathrm{T}Ax=0$ (b),b的解空间一定包含a的解空间(5分);
|
|
|
|
|
>而方程b两边同时乘以$x^\mathrm{T}$,得 $x^\mathrm{T}A^\mathrm{T}Ax=0$ ,即 $(x^\mathrm{T}A^\mathrm{T})(Ax)=0 \to Ax=0$,
|
|
|
|
|
>所以a的解空间包含b的解空间(5分),
|
|
|
|
|
>所以a,b同解,所以$\mathrm{rank}A=\mathrm{rank}{A^\mathrm{T}A}$
|
|
|
|
|
>(2) (10分)
|
|
|
|
|
>$A^\mathrm{T}Ax=A^\mathrm{T}\beta \iff \mathrm{rank}(A^\mathrm{T}A)=\mathrm{rank}(\begin{bmatrix}A^\mathrm{T}A&A^\mathrm{T}\beta\end{bmatrix})$
|
|
|
|
|
>而由(1)的结论得等式左边 $\mathrm{rank}(A^\mathrm{T}A)=\mathrm{rank}A$;
|
|
|
|
|
>等式右边 $\mathrm{rank}(\begin{bmatrix}A^\mathrm{T}A&A^\mathrm{T}\beta\end{bmatrix})\ge \mathrm{rank}A^\mathrm{T}A=\mathrm{rank}A$ (5分)
|
|
|
|
|
>又$\mathrm{rank}(A^\mathrm{T}\begin{bmatrix}A&\beta\end{bmatrix})\le \min{(\mathrm{rank}A^\mathrm{T},\ \mathrm{rank}\begin{bmatrix}A&\beta\end{bmatrix})}=\mathrm{rank}A$ (5分)
|
|
|
|
|
>所以$\mathrm{rank}(\begin{bmatrix}A^\mathrm{T}A&A^\mathrm{T}\beta\end{bmatrix})=\mathrm{rank}A$
|
|
|
|
|
>故 $\mathrm{rank}(A^\mathrm{T}A)=\mathrm{rank}(\begin{bmatrix}A^\mathrm{T}A&A^\mathrm{T}\beta\end{bmatrix})$ 得证.
|
|
|
|
|
|
|
|
|
|
>[!example] 例2
|
|
|
|
|
>已知$A, B, C, D$都是 4 阶非零矩阵,且$ABCD = O$,如果$|BC| \neq 0$,记$$r(A) + r(B) + r(C) + r(D) = r$$
|
|
|
|
|
>则$r$的最大值是( )。
|
|
|
|
|
>(A) 11
|
|
|
|
|
>(B) 12
|
|
|
|
|
>(C) 13
|
|
|
|
|
>(D) 14
|
|
|
|
|
|
|
|
|
|
**解析思路**:
|
|
|
|
|
- 由$|BC| \neq 0$知$B, C$均可逆。
|
|
|
|
|
- 由$ABCD = O$,故$r(AB) + r(CD) \le 4$,$r(A) + r(D) \le 4$
|
|
|
|
|
- 又$B, C$满秩,即$r(B) = r(C) = 4$。
|
|
|
|
|
- 于是$r = r(A) + r(B) + r(C) + r(D) \le 4 + 4 + 4 = 12$。
|
|
|
|
|
- 存在构造使等号成立,故最大值为$12$。
|
|
|
|
|
- 例如$$A =
|
|
|
|
|
\begin{pmatrix}
|
|
|
|
|
1 & 0 & 0 & 0 \\
|
|
|
|
|
0 & 1 & 0 & 0 \\
|
|
|
|
|
0 & 0 & 0 & 0 \\
|
|
|
|
|
0 & 0 & 0 & 0
|
|
|
|
|
\end{pmatrix},
|
|
|
|
|
\quad
|
|
|
|
|
D =
|
|
|
|
|
\begin{pmatrix}
|
|
|
|
|
0 & 0 & 0 & 0 \\
|
|
|
|
|
0 & 0 & 0 & 0 \\
|
|
|
|
|
1 & 0 & 0 & 0 \\
|
|
|
|
|
0 & 1 & 0 & 0
|
|
|
|
|
\end{pmatrix}$$
|
|
|
|
|
**答案**: (B) 12
|
|
|
|
|
|
|
|
|
|
|