|
|
|
|
@ -0,0 +1,372 @@
|
|
|
|
|
# Section 1 正交矩阵
|
|
|
|
|
## **正交矩阵**
|
|
|
|
|
**定理**
|
|
|
|
|
设${A}$为$n$阶实方阵,则 ${A}^\mathrm{T}{A}={E}$ 的充要条件是${A}$的列(行)向量组为标准正交向量组.
|
|
|
|
|
定义
|
|
|
|
|
若$\boldsymbol{A}$为n阶实矩阵,满足 ${A}^\mathrm{T}{A}={E}$,则称${A}$为正交矩阵.
|
|
|
|
|
**性质 1**
|
|
|
|
|
设$\boldsymbol{\varepsilon}_1,\boldsymbol{\varepsilon}_2,\dots,\boldsymbol{\varepsilon}_n$ 为 $\mathbb{R}^n$ 的标准正交基,若记 $A_{n\times n}=\begin{bmatrix}\boldsymbol{\varepsilon}_1&\boldsymbol{\varepsilon}_2&\dots&\boldsymbol{\varepsilon}_n\end{bmatrix}$,则 ${A}^\mathrm{T}{A}={E}$.
|
|
|
|
|
**性质 2**
|
|
|
|
|
若 $A$ 为正交矩阵,则 $|A|=1$ 或 $|A|=-1$。
|
|
|
|
|
**性质 3**
|
|
|
|
|
若 $A$ 为正交矩阵,则 $A^\mathrm{T},\;A^{-1},\;A^*$ 也是正交矩阵。
|
|
|
|
|
**性质 4**
|
|
|
|
|
若 $A,B$ 为 $n$ 阶正交矩阵,则 $AB$ 也是正交矩阵。
|
|
|
|
|
**性质 5**
|
|
|
|
|
若 $A$ 为 $n$ 阶正交矩阵,则对任意的 $\boldsymbol x\in\mathbb{R}^n$,有 $\|A\boldsymbol x\|=\|\boldsymbol x\|$。 可利用向量长度的定义进行分析:$\|A\boldsymbol x\|^2=\langle A\boldsymbol x,A\boldsymbol x\rangle=\boldsymbol x^\mathrm{T} A^\mathrm{T} A \boldsymbol x=x^\mathrm{T} \boldsymbol x=\|\boldsymbol x\|^2$.
|
|
|
|
|
|
|
|
|
|
这一性质提供了一个重要的线索:利用正交矩阵通过矩阵乘法对向量施行变换,所得向量与原向量的长度相同,同理可得向量的夹角也不变。因此在几何空间中进行几何变换,当变换矩阵为正交矩阵时可以保持图形的形状不变。
|
|
|
|
|
### **例子**
|
|
|
|
|
>[!example] 例题1
|
|
|
|
|
>设 $\boldsymbol{\alpha}$ 为 $n$ 维实列向量,且 $\|\boldsymbol{\alpha}\| = k$,令 $H = E - l\boldsymbol{\alpha}\boldsymbol{\alpha}^T$,其中 $k,l \in \mathbb{R}$。试讨论 $k,l$ 满足什么条件时 $H$ 为正交矩阵。
|
|
|
|
|
|
|
|
|
|
>[!note] **解析**
|
|
|
|
|
解题思路
|
|
|
|
|
正交矩阵的定义是:若矩阵 $H$ 满足 $H^T H = E$(其中 $E$ 为单位矩阵),则 $H$ 为正交矩阵。我们从这个定义出发推导条件。
|
|
|
|
|
>步骤1:写出 $H^T$
|
|
|
|
|
>已知 $H = E - l\boldsymbol \alpha\boldsymbol \alpha^T$,转置得
|
|
|
|
|
$$H^T = (E - l\boldsymbol \alpha\boldsymbol \alpha^T)^T = E^T - l(\boldsymbol \alpha\boldsymbol \alpha^T)^T = E - l\boldsymbol \alpha\boldsymbol \alpha^T$$
|
|
|
|
|
>(因为 $E^T=E$,且 $(\boldsymbol \alpha\boldsymbol \alpha^T)^T = \boldsymbol \alpha\boldsymbol \alpha^T$)
|
|
|
|
|
>步骤2:计算 $H^T H$
|
|
|
|
|
>$$\begin{align*}
|
|
|
|
|
H^T H &= (E - l\boldsymbol \alpha\boldsymbol \alpha^T)(E - l\boldsymbol \alpha\boldsymbol \alpha^T) \\
|
|
|
|
|
&= E \cdot E - E \cdot l\boldsymbol \alpha\boldsymbol \alpha^T - l\boldsymbol \alpha\boldsymbol \alpha^T \cdot E + l^2\boldsymbol \alpha\boldsymbol \alpha^T \cdot \boldsymbol \alpha\boldsymbol \alpha^T \\
|
|
|
|
|
&= E - 2l\boldsymbol \alpha\boldsymbol \alpha^T + l^2\boldsymbol \alpha(\alpha^T\boldsymbol \alpha)\boldsymbol \alpha^T
|
|
|
|
|
\end{align*}$$
|
|
|
|
|
>步骤3:代入$\boldsymbol \alpha^T\boldsymbol \alpha = \|\boldsymbol \alpha\|^2 = k^2 \Rightarrow H^T H = E - 2l\boldsymbol \alpha\boldsymbol \alpha^T + l^2 k^2 \boldsymbol \alpha\boldsymbol \alpha^T$
|
|
|
|
|
>合并同类项:
|
|
|
|
|
>$$H^T H = E + \left(-2l + l^2 k^2\right)\boldsymbol \alpha\boldsymbol \alpha^T$$
|
|
|
|
|
>步骤4:令 $H^T H = E$
|
|
|
|
|
>要使上式等于单位矩阵 $E$,必须满足:
|
|
|
|
|
>$$\left(-2l + l^2 k^2\right)\boldsymbol \alpha\boldsymbol \alpha^T = O$$
|
|
|
|
|
>($O$ 为零矩阵)
|
|
|
|
|
>若 $\boldsymbol \alpha \neq \boldsymbol 0(即 k \neq 0)$,则$\boldsymbol \alpha\boldsymbol \alpha^T \neq O$,因此系数必须为$0$:
|
|
|
|
|
$$-2l + l^2 k^2 = 0 \implies l(l k^2 - 2) = 0$$
|
|
|
|
|
>解得$l = 0$ 或 $l = \dfrac{2}{k^2}$。
|
|
|
|
|
>若 $\boldsymbol \alpha = \boldsymbol 0(即 k = 0$),则 $H = E$,显然 $H$ 是正交矩阵,此时对任意$l \in \mathbb{R}$ 均成立。
|
|
|
|
|
>最终结论$$\begin{aligned}
|
|
|
|
|
&1.\ \text{当}\ k = 0\ \text{时,对任意实数}\ l,\ H\ \text{为正交矩阵;} \\
|
|
|
|
|
&2.\ \text{当}\ k \neq 0\ \text{时,}l = 0\ \text{或}\ l = \dfrac{2}{k^2}\ \text{时,}H\ \text{为正交矩阵。}
|
|
|
|
|
\end{aligned}$$
|
|
|
|
|
|
|
|
|
|
>[!example] 例题2
|
|
|
|
|
>已知 $A$ = $[a_{ij}]_{n \times n}$为 $n\,(n \ge 2)$ 阶正交矩阵,证明:$A_{ij} = \pm a_{ij}\;(i,j=1,2,\dots,n)$,其中 $A_{ij}$ 为行列式 $|A|$ 中 $a_{ij}$ 的代数余子式。
|
|
|
|
|
|
|
|
|
|
>[!note] **解析**
|
|
|
|
|
>设 $A$为 $n$阶正交矩阵($n\ge2$),则 ${A}^T{A}={E}$
|
|
|
|
|
>又由伴随矩阵与逆矩阵的关系:$A^{-1} = \frac{1}{|A|}{A}^*$
|
|
|
|
|
>联立得 ${A}^T= \frac{1}{|A|}A^*$
|
|
|
|
|
>正交矩阵的行列式满足 $\frac{1}{|A|} =±1$,故 $A^*={|A|}A^T=±A^T$
|
|
|
|
|
>由伴随矩阵的定义,其第 $(j,i)$ 元为 $a_{ij}$ 的代数余子式 $A_{ij}$,而 $\pm A^T$ 的第 $(j,i)$ 元为 $±a_{ij}$。比较对应元素得$A_{ij}=±a_{ij},i,j=1,2,…,n.$
|
|
|
|
|
>证毕
|
|
|
|
|
## 施密特正交化法
|
|
|
|
|
|
|
|
|
|
设 $\boldsymbol{\alpha}_1,\boldsymbol{\alpha}_2,\dots,\boldsymbol{\alpha}_p$ 是向量空间 $V$ 的一组基,则用如下方法所得向量组 $\boldsymbol{\varepsilon}_1,\boldsymbol{\varepsilon}_2,\dots,\boldsymbol{\varepsilon}_p$ 为 $V$ 的一组标准正交基
|
|
|
|
|
$$\begin{align*}
|
|
|
|
|
\boldsymbol{u}_1 &= \boldsymbol{\alpha}_1, \\
|
|
|
|
|
\boldsymbol{u}_k &= \boldsymbol{\alpha}_k - \sum_{i=1}^{k-1}\frac{\langle\boldsymbol{\alpha}_k,\boldsymbol{u}_i\rangle}{\langle\boldsymbol{u}_i,\boldsymbol{u}_i\rangle}\boldsymbol{u}_i,\quad k=2,3,\dots,p.
|
|
|
|
|
\end{align*}$$
|
|
|
|
|
单位化得
|
|
|
|
|
$$\boldsymbol{\varepsilon}_k = \frac{\boldsymbol{u}_k}{\|\boldsymbol{u}_k\|},\quad
|
|
|
|
|
k=1,2,3,\dots,p$$
|
|
|
|
|
还有另一个更加常用的正交化法:$$\begin{aligned}
|
|
|
|
|
\boldsymbol u_1&=\boldsymbol\alpha_1,\boldsymbol\varepsilon_1=\dfrac{\boldsymbol u_1}{\|\boldsymbol u_1\|},\\
|
|
|
|
|
\boldsymbol u_k&=\boldsymbol\alpha_k-\sum_{i=1}^{k-1}\langle\boldsymbol\varepsilon_i,\boldsymbol\alpha_k\rangle\boldsymbol\varepsilon_i,\boldsymbol\varepsilon_k=\dfrac{\boldsymbol u_k}{\|\boldsymbol u_k\|}(k=2,3,\cdots,p).
|
|
|
|
|
\end{aligned}$$
|
|
|
|
|
### **例子**
|
|
|
|
|
>[!example] **例3**
|
|
|
|
|
已知 $\boldsymbol{\alpha}_1,\boldsymbol{\alpha}_2,\dots,\boldsymbol{\alpha}_5$ 为欧氏空间 $V$ 的一组标准正交基,令$$\boldsymbol{\beta}_1 = \boldsymbol{\alpha}_1+\boldsymbol{\alpha}_3,\quad
|
|
|
|
|
\boldsymbol{\beta}_2 = \boldsymbol{\alpha}_1-\boldsymbol{\alpha}_2+\boldsymbol{\alpha}_4,\quad
|
|
|
|
|
\boldsymbol{\beta}_3 = 2\boldsymbol{\alpha}_1+\boldsymbol{\alpha}_2+\boldsymbol{\alpha}_3,$$
|
|
|
|
|
$U = \text{span}\{\boldsymbol{\beta}_1,\boldsymbol{\beta}_2,\boldsymbol{\beta}_3\}$求 $U$ 的一个标准正交基。
|
|
|
|
|
|
|
|
|
|
>[!note] **解析**:
|
|
|
|
|
>施密特正交化
|
|
|
|
|
>步骤1:正交化
|
|
|
|
|
>取$$ \boldsymbol{\gamma}_1=\boldsymbol{\beta}_1=\boldsymbol{\alpha}_1+\boldsymbol{\alpha}_3,\ \
|
|
|
|
|
\boldsymbol{\gamma}_2=\boldsymbol{\beta}_2-\dfrac{\langle\boldsymbol{\beta}_2,\boldsymbol{\gamma}_1\rangle}{\langle\boldsymbol{\gamma}_1,\boldsymbol{\gamma}_1\rangle}\boldsymbol{\gamma}_1$$$$\langle\boldsymbol{\beta}_2,\boldsymbol{\gamma}_1\rangle=1,\quad
|
|
|
|
|
\langle\boldsymbol{\gamma}_1,\boldsymbol{\gamma}_1\rangle=2$$
|
|
|
|
|
>$$\boldsymbol{\gamma}_2=\frac{1}{2}\boldsymbol{\alpha}_1-\boldsymbol{\alpha}_2-\frac{1}{2}\boldsymbol{\alpha}_3+\boldsymbol{\alpha}_4$$
|
|
|
|
|
>$$\boldsymbol{\gamma}_3=\boldsymbol{\beta}_3-\dfrac{\langle\boldsymbol{\beta}_3,\boldsymbol{\gamma}_1\rangle}{\langle\boldsymbol{\gamma}_1,\boldsymbol{\gamma}_1\rangle}\boldsymbol{\gamma}_1-\dfrac{\langle\boldsymbol{\beta}_3,\boldsymbol{\gamma}_2\rangle}{\langle\boldsymbol{\gamma}_2,\boldsymbol{\gamma}_2\rangle}\boldsymbol{\gamma}_2$$
|
|
|
|
|
>$$\langle\boldsymbol{\beta}_3,\boldsymbol{\gamma}_1\rangle=3,\quad
|
|
|
|
|
\langle\boldsymbol{\beta}_3,\boldsymbol{\gamma}_2\rangle=0$$
|
|
|
|
|
>$$\boldsymbol{\gamma}_3=-\boldsymbol{\alpha}_1+2\boldsymbol{\alpha}_2+\boldsymbol{\alpha}_3+3\boldsymbol\alpha_4$$
|
|
|
|
|
>步骤2:单位化
|
|
|
|
|
$$\boldsymbol{\varepsilon}_1=\dfrac{\boldsymbol{\gamma}_1}{\|\boldsymbol{\gamma}_1\|}=\dfrac{\boldsymbol{\alpha}_1+\boldsymbol{\alpha}_3}{\sqrt{2}}$$
|
|
|
|
|
$$\|\boldsymbol{\gamma}_2\|=\sqrt{\dfrac{5}{2}},\boldsymbol{\varepsilon}_2=\dfrac{\boldsymbol{\alpha}_1-2\boldsymbol{\alpha}_2-\boldsymbol{\alpha}_3+2\boldsymbol{\alpha}_4}{\sqrt{10}}$$
|
|
|
|
|
$$\|\boldsymbol{\gamma}_3\|=\sqrt{\dfrac{3}{2}},\boldsymbol{\varepsilon}_3=\dfrac{-\boldsymbol{\alpha}_1+2\boldsymbol{\alpha}_2+\boldsymbol{\alpha}_3+3\boldsymbol\alpha_4}{\sqrt{19}}$$
|
|
|
|
|
>$U$ 的标准正交基为
|
|
|
|
|
>$$\boldsymbol{\varepsilon}_1=\frac{\boldsymbol{\alpha}_1+\boldsymbol{\alpha}_3}{\sqrt{2}},\quad
|
|
|
|
|
\boldsymbol{\varepsilon}_2=\frac{\boldsymbol{\alpha}_1-2\boldsymbol{\alpha}_2-\boldsymbol{\alpha}_3+2\boldsymbol{\alpha}_4}{\sqrt{10}},\quad
|
|
|
|
|
\boldsymbol{\varepsilon}_3=\dfrac{-\boldsymbol{\alpha}_1+2\boldsymbol{\alpha}_2+\boldsymbol{\alpha}_3+3\boldsymbol\alpha_4}{\sqrt{19}}$$
|
|
|
|
|
|
|
|
|
|
>[!example] **例4**
|
|
|
|
|
>已知 $A$ $=$ $[\boldsymbol{\alpha}_1\ \boldsymbol{\alpha}_2\ \boldsymbol{\alpha}_3\ \boldsymbol{\alpha}_4]$ 为正交矩阵,其中
|
|
|
|
|
>$$\boldsymbol{\alpha}_3 = \frac{1}{3}\begin{bmatrix}1\\-2\\0\\2\end{bmatrix},\quad
|
|
|
|
|
\boldsymbol{\alpha}_4 = \frac{1}{6}\begin{bmatrix}2\sqrt{6}\\0\\-\sqrt{6}\\-\sqrt{6}\end{bmatrix}$$
|
|
|
|
|
试求一个$\boldsymbol{\alpha}_1$ 和一个 $\boldsymbol{\alpha}_2$。
|
|
|
|
|
|
|
|
|
|
>[!note] **解析**
|
|
|
|
|
>$\boldsymbol{\alpha}_1,\boldsymbol{\alpha}_2$必须与 $\boldsymbol{\alpha}_3,\boldsymbol{\alpha}_4$都正交,且$\boldsymbol{\alpha}_1 与 \boldsymbol{\alpha}_2$ 也正交,模长为 $1$。
|
|
|
|
|
>设 $\boldsymbol{x}=(x_1,x_2,x_3,x_4)^T$,正交条件等价于方程组:
|
|
|
|
|
>$$\begin{cases}
|
|
|
|
|
\langle\boldsymbol{x},\boldsymbol{\alpha}_3\rangle = x_1 - 2x_2 + 2x_4 = 0\\
|
|
|
|
|
\langle\boldsymbol{x},\boldsymbol{\alpha}_4\rangle = 2\sqrt{6}x_1 - \sqrt{6}x_3 - \sqrt{6}x_4 = 0 \implies 2x_1 - x_3 - x_4 = 0
|
|
|
|
|
\end{cases}$$
|
|
|
|
|
>解上述齐次方程组,得到两个线性无关的解:
|
|
|
|
|
>$$\boldsymbol{\xi}_1=(2,1,4,0)^T,\quad
|
|
|
|
|
\boldsymbol{\xi}_2=(0,1,-1,1)^T$$
|
|
|
|
|
>用施密特正交化法得 $$\boldsymbol u_1=\boldsymbol \xi_1,\boldsymbol\varepsilon_1=\dfrac{\boldsymbol u_1}{\|\boldsymbol u_1\|}=\dfrac{1}{\sqrt{21}}(2,1,4,0)^\text{T},$$
|
|
|
|
|
>$$\boldsymbol u_2=\boldsymbol \xi_2-\langle\boldsymbol \xi_2,\boldsymbol \varepsilon_1\rangle\boldsymbol \varepsilon_1=\dfrac{1}{7}(2,8,-3,7)^\text{T},\boldsymbol \varepsilon_2=\dfrac{\boldsymbol u_2}{\|\boldsymbol u_2\|}=\dfrac{1}{4\sqrt 5}(2,0,-3,7)^\text T$$
|
|
|
|
|
>满足条件的一组标准正交向量为:$$\boldsymbol{\varepsilon}_1 = \frac{1}{\sqrt{21}}\begin{bmatrix}2\\1\\4\\0\end{bmatrix},\quad\boldsymbol{\varepsilon}_2 = \frac{1}{4\sqrt{5}}\begin{bmatrix}2\\0\\-3\\7\end{bmatrix}.$$
|
|
|
|
|
|
|
|
|
|
# Section 2 实对称矩阵的正交变换与二次型
|
|
|
|
|
|
|
|
|
|
## 正交变换及合同
|
|
|
|
|
|
|
|
|
|
>[!danger] 待整合
|
|
|
|
|
>与一个**实对称矩阵** 相似:特征值及其几何重数、代数重数相等
|
|
|
|
|
>合同:惯性相同(正惯性指数、负惯性指数、$0$ 数都相同)且本身也是**实对称矩阵**.
|
|
|
|
|
>即:如果 $A$ 与 $B$ 合同,且 $A$ 是实对称矩阵,则 $B$ 也是实对称矩阵。
|
|
|
|
|
>证明:$B=P^\mathrm TAP \Rightarrow B^\mathrm T=(P^\mathrm TAP)^\mathrm T=P^\mathrm TA^\mathrm TP=P^\mathrm TAP$,即 $B^\mathrm T=B$
|
|
|
|
|
|
|
|
|
|
>[!example] 例题
|
|
|
|
|
>已知三阶实对称矩阵 $A$ 与 $\begin{bmatrix}2&0&0\\0&1&0\\0&0&-3\end{bmatrix}$ 相似,则下列矩阵中,与 $A$ 相似但不合同的是
|
|
|
|
|
>A. $\begin{bmatrix}1&1&1\\1&1&1\\1&1&1\end{bmatrix}\qquad$ B. $\begin{bmatrix}-3&0&0\\0&1&0\\0&0&2\end{bmatrix}\qquad$ C. $\begin{bmatrix}-3&1&1\\0&1&1\\0&0&2\end{bmatrix}\qquad$ D. $\begin{bmatrix}1&0&0\\0&-2&0\\0&0&3\end{bmatrix}$
|
|
|
|
|
|
|
|
|
|
>[!note] 解析
|
|
|
|
|
>与一个**实对称矩阵** 相似:特征值及其几何重数、代数重数相等
|
|
|
|
|
>合同:惯性相同(正惯性指数、负惯性指数、$0$数都相同)且本身也是**实对称矩阵**
|
|
|
|
|
> $C$ 选项的特征值与 $A$ 相同,然而, $C$ 选项的矩阵不是对称矩阵
|
|
|
|
|
|
|
|
|
|
## 二次型
|
|
|
|
|
|
|
|
|
|
二次型,顾名思义,就是二次函数,只不过是 $n$ 元函数,当元数比较小时,我们可以清楚地画出它的图像,判断其几何形状,推得相应对的性质,然而一旦维度升高,我们是无法想象其空间几何构型的,只能从代数的角度了解其性质。因此引入二次型矩阵的概念,通过描述矩阵性质,进而得出函数的性质。
|
|
|
|
|
|
|
|
|
|
首先,需要注意的是,二次型矩阵是人为定义的矩阵(只要满足一一对应就可以),为了更好的性质,我们选择了**实对称矩阵**作为描述对象。
|
|
|
|
|
|
|
|
|
|
二次型中有许多 $x_ix_j$ 的交叉项,它会影响我们对函数正负的判断,而在矩阵上也就对应非对角线元素,我们想通过换元将交叉项消掉,只留下平方项。对应换元用线性代换思想描述就是 $\boldsymbol x=C\boldsymbol y$ ,其中 $C$ 可逆,然后也就是说 $f=\boldsymbol x^\mathrm TA\boldsymbol x=(C\boldsymbol y)^\mathrm TA(C\boldsymbol y)=\boldsymbol y^\mathrm T(C^\mathrm TAC)\boldsymbol y$ ,视 $\boldsymbol y$ 为新的变元,其对应的矩阵为 $C^\mathrm TAC$,由于 $C$ 是可逆变换,我们研究 $\boldsymbol y$,倒推回去就是研究 $\boldsymbol x$,(注意:可逆是非常重要的,并且经常被忽略),记 $B=C^\mathrm TAC$,回到最初想法“想通过换元将交叉项消掉,只留下平方项’’,换言之,通过找 $C$ ,使得 $B$ 变成对角阵。这也是贯穿二次型章节的一个重要问题。
|
|
|
|
|
|
|
|
|
|
我们称换元后得到只含平方项的函数为标准型,平方项前面的系数,只要不变号,就能随便取,显然,标准型是无穷多的,因为换元是千奇百怪的。
|
|
|
|
|
|
|
|
|
|
继续抽丝剥茧,称只含平方项的二次函数,且平方项系数只为 $1$ ,$-1$ 或 $0$ 的为规范形,一个二次型的规范形是唯一的。
|
|
|
|
|
|
|
|
|
|
规范型的唯一性,恰是二次型最核心的代数本质体现——二次型的惯性。无论我们选取何种可逆线性代换,无论中间的标准型如何千变万化,二次型中平方项系数为 $1$、$-1$ 的项的个数始终固定不变,这两个固定的个数,便分别被称为二次型的**正惯性指数**与**负惯性指数**,而系数为 $0$ 的项的个数,自然就是变元个数与正、负惯性指数之和的差值。
|
|
|
|
|
|
|
|
|
|
这一不变性并非偶然,而是由“惯性定理”严格保证的:任意一个实二次型,都可以通过可逆线性代换化为唯一的规范型,其正、负惯性指数是二次型本身固有的属性,与所选的线性代换无关。换句话说,惯性指数是二次型的“不变量”,它深刻反映了二次型在可逆变换下的本质特征,就像物体的质量一样,不随坐标系的转换而改变。而我们常用的化二次型为标准型的方法有正交变换法、配方法,本质上都依托可逆线性代换,与合同变换紧密关联,这些方法的步骤、特点及与惯性定理的关联,存在明确区别与内在联系,具体可梳理如下:
|
|
|
|
|
#### (一)配方法(可逆线性代换,最通用便捷)
|
|
|
|
|
|
|
|
|
|
配方法通过代数配方手段消去交叉项,直接构造可逆线性代换 $\boldsymbol x=C\boldsymbol y$ ,将二次型化为标准型,无需依赖矩阵的特征值、特征向量,适用所有实二次型。
|
|
|
|
|
|
|
|
|
|
>[!tip] 核心步骤:
|
|
|
|
|
>1.若二次型含某变量的平方项(如 $x_1^2$ ),先将含 $x_1$ 的所有项归并,配成完全平方,消去含 $x_1$ 的交叉项;
|
|
|
|
|
>2.对剩余变量重复上述步骤,直至所有交叉项消去,得到仅含平方项的标准型;
|
|
|
|
|
>3.反向推导得到可逆线性代换 $\boldsymbol x=C\boldsymbol y$ ,对应的矩阵变换为 $C^TAC=\Lambda$ ( $\Lambda$ 为对角阵,对角元为标准型系数)。
|
|
|
|
|
|
|
|
|
|
**特点**:操作简单、计算量小,可灵活构造代换矩阵 $C$;但标准型系数不唯一(随配方方式变化),且 $C$ 不一定是正交矩阵,变换不保持几何度量(如长度、夹角)。
|
|
|
|
|
#### **(二)合同变换法(直接作用于矩阵,直观体现合同关系)**
|
|
|
|
|
|
|
|
|
|
合同变换法直接对实对称矩阵 $A$ 进行初等变换,通过“初等行变换+同步初等列变换”,将 $A$ 化为对角阵 $\Lambda$ ,同步记录初等列变换得到可逆矩阵 $C$,本质是直接构造 $C^TAC=\Lambda$ 。
|
|
|
|
|
|
|
|
|
|
>[!tip] 核心步骤:
|
|
|
|
|
>1. 构造分块矩阵 $\begin{bmatrix}A\\E\end{bmatrix}$ ($E$为单位矩阵);
|
|
|
|
|
>2. 对 $A$ 施行初等行变换的同时,对整个分块矩阵的列施行相同的初等列变换,使 $A$ 化为对角阵 $\Lambda$ ;
|
|
|
|
|
>3. 此时下方单位矩阵 $E$ 同步化为可逆矩阵 $C$,满足 $C^TAC=\Lambda$ ,对应线性代换 $X=CY$ ,二次型化为标准型 $f=\lambda_{11}y_1^2+\lambda_{22}y_2^2+...+\lambda_{nn}y_n^2$ 。
|
|
|
|
|
|
|
|
|
|
**特点**:直接关联矩阵合同关系,**直观体现二次型化标准型的本质**;标准型系数不唯一,C由初等变换直接得到;适用于需明确合同矩阵的场景,计算量介于配方法与正交变换法之间。
|
|
|
|
|
#### (三)**正交变换法(特殊可逆代换,保几何度量)**
|
|
|
|
|
|
|
|
|
|
正交变换法利用实对称矩阵可正交对角化的性质,构造正交矩阵 $Q$(满足 $Q^T=Q^{-1}$ ),使 $Q^TAQ=\Lambda$ ,其中 $\Lambda$ 的对角元为 $A$ 的特征值,对应的线性代换 $X=QY$ 为正交变换。
|
|
|
|
|
>[!tip] 核心步骤:
|
|
|
|
|
>1. 求二次型对应实对称矩阵 $A$ 的全部特征值 $\lambda_1,\lambda_2,...,\lambda_n$
|
|
|
|
|
>对每个特征值,求对应的特征向量,并将属于同一特征值的特征向量正交化;
|
|
|
|
|
>2. 将所有正交化后的特征向量单位化,得到正交矩阵 $Q$;
|
|
|
|
|
>3. 作正交变换 $X=QY$ ,二次型化为标准型$f=\lambda_1y_1^2+\lambda_2y_2^2+...+\lambda_ny_n^2$ 。
|
|
|
|
|
|
|
|
|
|
**特点**:标准型系数为 $A$ 的特征值,具有唯一性(不计顺序);正交变换保持向量长度、夹角不变,几何意义明确(如旋转、反射变换);但计算量较大,需求解特征值和特征向量。
|
|
|
|
|
|
|
|
|
|
#### 方法间核心区别与关联
|
|
|
|
|
**区别**:见下表
|
|
|
|
|
|
|
|
|
|
|方法|配方法|合同变换法|正交变换法|
|
|
|
|
|
|:---:|:----:|:----:|:----------------:|
|
|
|
|
|
| 本质 | 一般合同变换 | 一般合同变换 | 正交合同变换,变换矩阵为正交矩阵 |
|
|
|
|
|
| 标准型系数 | 仅保持惯性 | 仅保持惯性 | 特征值 |
|
|
|
|
|
| 计算复杂度 | 低 | 中 | 高 |
|
|
|
|
|
| 几何意义 | 无几何约束 | 无几何约束 | 保持几何度量(变换后图形形状不改变) |
|
|
|
|
|
>[!faq] 思考
|
|
|
|
|
>正交变换法的“保持几何度量”如何反映在代数方面?
|
|
|
|
|
|
|
|
|
|
**关联**:所有方法均基于可逆线性代换,本质都是矩阵的合同对角化;无论哪种方法得到的标准型,其正、负惯性指数均由惯性定理保证恒定,最终都可通过进一步代换化为唯一的规范型。
|
|
|
|
|
#### 考察方向
|
|
|
|
|
>[!summary] 二次型的题目有以下几种基本考点:
|
|
|
|
|
>1. 求标准型(规范型);
|
|
|
|
|
>2. 求把二次型变为标准型的正交变换矩阵;
|
|
|
|
|
>3. 求一定条件下二次型函数的最值;
|
|
|
|
|
>4. 正定性。
|
|
|
|
|
|
|
|
|
|
>[!summary] 最基本的方法:
|
|
|
|
|
>1. 求特征值和特征向量;
|
|
|
|
|
>2. 把特征向量拼接起来成为变换矩阵;
|
|
|
|
|
>3. 或者把特征向量标准正交化,再拼接起来成为正交变换矩阵。
|
|
|
|
|
##### 求标准形
|
|
|
|
|
1. 已知二次型(直接求)
|
|
|
|
|
>[!example] ([[线代2022秋B|2022]])例题
|
|
|
|
|
>设实二次型 $f(x_1,x_2,x_3)=2x_1^2+2x_2^2+2x_3^2+2x_1x_2-2x_1x_3-2x_2x_3$ 通过正交变换 $\boldsymbol x=P\boldsymbol y$ 可化为标准形,求所用的正交变换 $\boldsymbol x=P\boldsymbol y$ 及对应的标准形.
|
|
|
|
|
|
|
|
|
|
>[!note] 解:
|
|
|
|
|
> 二次型的矩阵为 $A=\begin{bmatrix}2&1&-1\\1&2&-1\\-1&-1&2\end{bmatrix}$
|
|
|
|
|
> 其特征多项式为 $|\lambda E-A|=\begin{bmatrix}\lambda-2&-1&1\\-1&\lambda-2&1\\1&1&\lambda-2\end{bmatrix}=\begin{bmatrix}\lambda-1&-1&1\\1-\lambda&\lambda-2&1\\0&1&\lambda-2\end{bmatrix}=\begin{bmatrix}\lambda-1&-1&1\\0&\lambda-3&2\\0&1&\lambda-2\end{bmatrix}$
|
|
|
|
|
> 即为 $(\lambda-1)^2(\lambda-4)$
|
|
|
|
|
> 故 $A$ 的特征值为 $1,1,4$
|
|
|
|
|
> 当 $\lambda=1$ 时,解方程 $(E-A)\boldsymbol x=\boldsymbol 0$,对方程组的系数矩阵进行初等行变换:$E-A=\begin{bmatrix}-1&-1&1\\-1&-1&1\\1&1&-1\end{bmatrix}\to\begin{bmatrix}1&1&-1\\0&0&0\\0&0&0\end{bmatrix}$
|
|
|
|
|
> 得特征向量 $\boldsymbol\alpha_1=\begin{bmatrix}-1\\1\\0\end{bmatrix},\boldsymbol\alpha_2=\begin{bmatrix}1\\1\\2\end{bmatrix}$.
|
|
|
|
|
> 当 $\lambda=4$ 时,解方程组 $(4E-A)\boldsymbol x=\boldsymbol 0$,对方程组的系数矩阵进行初等行变换:$4E-A=\begin{bmatrix}2&-1&1\\-1&2&1\\1&1&2\end{bmatrix}\to\begin{bmatrix}1&0&1\\0&1&1\\0&0&0\end{bmatrix}$
|
|
|
|
|
> 得特征向量 $\boldsymbol\alpha_1=\begin{bmatrix}-1\\-1\\1\end{bmatrix}$
|
|
|
|
|
> 令 $P_0=\begin{bmatrix}-1&1&-1\\1&1&-1\\0&2&1\end{bmatrix}$,对 $P_0$ 作正交化得 $P$,$P=\begin{bmatrix}-\frac{1}{\sqrt{2}}&\frac{1}{\sqrt{6}}&-\frac{1}{\sqrt{3}}\\\frac{1}{\sqrt{2}}&\frac{1}{\sqrt{6}}&-\frac{1}{\sqrt{3}}\\0&\frac{2}{\sqrt{6}}&\frac{1}{\sqrt{3}}\end{bmatrix}$
|
|
|
|
|
> 对应的标准形矩阵 $\Lambda=\begin{bmatrix}1&&\\&1&\\&&4\end{bmatrix}$,标准形为 $y_1^2+y_2^2+4y_3^2$
|
|
|
|
|
|
|
|
|
|
2. 含参数的二次型
|
|
|
|
|
通常而言,这种二次型需要根据提供的额外信息,并结合相关性质(e.g. 特征值和与积的相关性质)求出未知参数,然后按照已知二次型的求法来求解。
|
|
|
|
|
>[!example] 例题
|
|
|
|
|
>设二次型 $\displaystyle f(x_1,x_2,x_3)=ax_1^2+2x_2^2-2x_3^2+2bx_1x_3,(b>0),$ 其中二次型的矩阵特征值之和为 $1$,之积为 $-12$. 求正交变换将二次型化为标准型.
|
|
|
|
|
|
|
|
|
|
>[!note] 解:
|
|
|
|
|
>二次型的矩阵为 $\displaystyle \boldsymbol A=\begin{bmatrix}1&0&b\\0&2&0\\b&0&-2\end{bmatrix}$,设其特征值分别为 $\lambda_1,\lambda_2,\lambda_3$, 则有$$\begin{aligned}\lambda_1\lambda_2\lambda_3=|\boldsymbol A|=2(-2a&-b^2)=-12,\lambda_1+\lambda_2+\lambda_3=a+2-2=1\\&\implies a=1,b=2.\end{aligned}$$从而有$\displaystyle|\lambda\boldsymbol E-\boldsymbol A|=(\lambda-2)^2(\lambda-3)=0\implies \lambda_1=\lambda_2=2,\lambda_3=-3.$
|
|
|
|
|
>考虑 $\lambda=2$,则 $\displaystyle 2\boldsymbol E-\boldsymbol A=\begin{bmatrix}1&0&-2\\0&0&0\\-2&0&4\end{bmatrix}\rightarrow\begin{bmatrix}1&0&-2\\0&0&0\\0&0&0\end{bmatrix}$, 于是特征值 $2$ 的几何重数为 $2$, 对应的线性无关的特征向量可以为 $\displaystyle\xi_1=(2,0,1)^T,\xi_2=(0,1,0)^T$.
|
|
|
|
|
>考虑 $\lambda=-3$,则 $\displaystyle -3\boldsymbol E-\boldsymbol A=\begin{bmatrix}-4&0&-2\\0&-5&0\\-2&0&-1\end{bmatrix}\rightarrow\begin{bmatrix}2&0&1\\0&1&0\\0&0&0\end{bmatrix}$,则特征值 $-3$ 几何重数为 $1$, 对应的特征向量为 $\xi_3=(-1,0,2)^T$.
|
|
|
|
|
>对上述三个特征向量正交化得 $\varepsilon_1=(\frac{2}{\sqrt{5}},0,\frac{1}{\sqrt{5}})^T,\varepsilon_2=(0,1,0)^T,\varepsilon_3=(-\frac{1}{\sqrt{5}},0,\frac{2}{\sqrt{5}})^T$,故正交变换为 $\boldsymbol C=\begin{bmatrix}\frac{2}{\sqrt{5}}&0&\frac{1}{\sqrt{5}}\\0&1&0\\-\frac{1}{\sqrt{5}}&0&\frac{2}{\sqrt{5}}\end{bmatrix},$ 标准型为 $\displaystyle f=2y_1^2+2y_2^2-3y_3^2.$
|
|
|
|
|
|
|
|
|
|
>[!example] 例题
|
|
|
|
|
>已知二次型 $\displaystyle f(x_1,x_2,x_3)=x_1^2+2x_2^2+ax_3^2+2x_1x_3$ 经可逆线性变换 $\boldsymbol x=\boldsymbol P \boldsymbol y$ 化为 $\displaystyle y_1^2+y_2^2$.
|
|
|
|
|
>(1)求 $a$ 的值及可逆矩阵 $\boldsymbol P$;
|
|
|
|
|
>(2)当 $\boldsymbol x=(x_1,x_2,x_3)^T$ 且 $\boldsymbol x^T\boldsymbol x=1$ 时,求 $f(x_1,x_2,x_3)$ 的最大值,并求满足 $x_1=x_2>0$ 的最大值点.
|
|
|
|
|
|
|
|
|
|
>[!note] 解:
|
|
|
|
|
>(1)由题意知 $f$ 的正惯性指数为 $2$,负惯性指数为 $0$. 二次型的矩阵为 $\boldsymbol A=\begin{bmatrix}1&0&1\\0&2&0\\1&0&a\end{bmatrix}$, 则 $\boldsymbol A$ 有特征值 $0$,所以 $|\boldsymbol A|=0\implies2(a-1)=0\implies a=1$, 故 $\boldsymbol A=\begin{bmatrix}1&0&1\\0&2&0\\1&0&1\end{bmatrix}.$
|
|
|
|
|
>考虑特征多项式 $|\lambda\boldsymbol E-\boldsymbol A|=\lambda(\lambda-2)^2=0 \implies \lambda_1=0,\lambda_2=\lambda_3=2.$
|
|
|
|
|
>$\lambda=0$ 时,$-\boldsymbol A\rightarrow \begin{bmatrix}1&0&1\\0&1&0\\0&0&0\end{bmatrix}$, 取 $\eta_1=(1,0,-1)^T$;
|
|
|
|
|
>$\lambda=2$ 时,$2\boldsymbol E-\boldsymbol A\rightarrow \begin{bmatrix}1&0&-1\\0&0&0\\0&0&0\end{bmatrix}$, 取 $\eta_2=(1,0,1)^T,\eta_3=(0,1,0)^T$.
|
|
|
|
|
>取 $\boldsymbol P_1=\begin{bmatrix}\eta_3\ \eta_2\ \eta_1\end{bmatrix}$, 则有 $\boldsymbol P_1^T\boldsymbol A\boldsymbol P_1=\begin{bmatrix}2&0&0\\0&2&0\\0&0&0\end{bmatrix},$ 再取 $\boldsymbol P_2=\begin{bmatrix}\frac{1}{\sqrt{2}}&0&0\\0&\frac{1}{\sqrt{2}}&0\\0&0&1\end{bmatrix}$, 有$\boldsymbol P_2^T\boldsymbol P_1^T\boldsymbol A\boldsymbol P_1\boldsymbol P_2=(\boldsymbol P_1\boldsymbol P_2)^T\boldsymbol A(\boldsymbol P_1\boldsymbol P_2)=\begin{bmatrix}1&0&0\\0&1&0\\0&0&0\end{bmatrix}$, 所以 $\boldsymbol P=\boldsymbol P_1\boldsymbol P_2=\begin{bmatrix}0&\frac{1}{\sqrt{2}}&1\\\frac{1}{\sqrt{2}}&0&0\\0&\frac{1}{\sqrt{2}}&-1\end{bmatrix}$.
|
|
|
|
|
>(2)由 $\boldsymbol x^T\boldsymbol x=1$ 知 $x_1^2+x_2^2+x_3^2=1$. 由(1)知,存在正交变换 $\boldsymbol x=C\boldsymbol z$,使得 $\displaystyle f\overset{\boldsymbol x=C\boldsymbol z}{=}2(z_1^2+z_2^2)$. 由于正交变换不改变向量长度,有 $z_1^2+z_2^2+z_3^2=1\Rightarrow z_1^2+z_2^2=1-z_3^2$, 带入得 $$f=2(1-z_3^2)\le2, \text{等号当且仅当} z_3=0 \text{时取得.}$$
|
|
|
|
|
>由(1),可取正交矩阵 $\displaystyle C=\begin{bmatrix}\frac{1}{\sqrt{2}} & 0 & \frac{1}{\sqrt{2}} \\0 & 1 & 0 \\\frac{1}{\sqrt{2}} & 0 & -\frac{1}{\sqrt{2}}\end{bmatrix}$,则 $\displaystyle \boldsymbol x=\begin{bmatrix}\frac{z_1}{\sqrt{2}} \\ z_2 \\ \frac{z_1}{\sqrt{2}}\end{bmatrix}$. 当 $x_1=x_2$ 时, $\displaystyle z_1=\sqrt 2z_2=\frac{\sqrt 6}{3}\Rightarrow x_1=x_2=x_3=\frac{1}{\sqrt 3}$. 故 当$\boldsymbol x=\begin{bmatrix}\frac{1}{\sqrt{3}} \\[4pt]\frac{1}{\sqrt{3}} \\[4pt]\frac{1}{\sqrt{3}}\end{bmatrix}$ 时,$f_{\max}=2.$
|
|
|
|
|
|
|
|
|
|
>[!attention] 注意!
|
|
|
|
|
>经可逆线性变换 $\boldsymbol x=\boldsymbol P \boldsymbol y$ 得到的标准形只能保持惯性不变,只能反映特征值的正负,其系数不等于特征值!在做题时一定要看清楚是**可逆线性变换**还是**正交变换**!
|
|
|
|
|
|
|
|
|
|
>[!attention] 注意!
|
|
|
|
|
>变换矩阵中列向量排列的顺序要和对角矩阵中元素的顺序保持一致!
|
|
|
|
|
|
|
|
|
|
上面的那道题用到了正交变换几何形状不变的优良特性,当 $||\boldsymbol x||=1$ 时,正交变换得到的 $\boldsymbol z$ 也满足 $||\boldsymbol z||=1$,因为不改变向量长度。
|
|
|
|
|
类似的题目还有:
|
|
|
|
|
>[!example] ([[线代2023秋A|2023]])例题
|
|
|
|
|
>已知实二次型 $f(x_{1},x_{2},x_{3}) = 2x_{1}^{2} + x_{2}^{2} - 4x_{1}x_{2} + 2ax_{2}x_{3} \quad (a\geq 0)$ 通过正交变换$\pmb {x} = Q\pmb{y}$ 可化为标准形$y_{1}^{2} - 2y_{2}^{2} + 4y_{3}^{2}$。
|
|
|
|
|
>(1) 求 $a$ 的值及正交矩阵 ${Q}$。
|
|
|
|
|
>(2) 当 $\| \boldsymbol {x}\| = 2$ 时,求解一个向量 $\pmb{x}$ 使得 $f(x_{1},x_{2},x_{3})$ 取最大值。
|
|
|
|
|
|
|
|
|
|
>[!note] 解析
|
|
|
|
|
>(1) 由已知条件得 $A=\begin{bmatrix}2&-2&0\\2&1&a\\0&a&0\end{bmatrix}$ 的三个特征值为 $\lambda_1=1,\lambda_2=-2,\lambda_3=4$,
|
|
|
|
|
>又由 $|A|=\begin{vmatrix}2&-2&0\\-2&1&a\\0&a&0\end{vmatrix}=-2a^2=-8$ 且 $a\ge0$ 得 $a=2$,故 $A=\begin{bmatrix}2&-2&0\\-2&1&2\\0&2&0\end{bmatrix}$,
|
|
|
|
|
>将 $\lambda_1=1$ 代入 $(\lambda E-A)\boldsymbol x=\boldsymbol0$ 并求解得
|
|
|
|
|
>$E-A=\begin{bmatrix}-1&2&0\\2&0&-2\\0&-2&1\end{bmatrix}\to \begin{bmatrix}1&0&-1\\0&1&-\frac{1}{2}\\0&0&0\end{bmatrix}$
|
|
|
|
|
>故对应 $\lambda_1=1$ 的特征向量为 $\xi_1=(2,1,2)^\mathrm T$;
|
|
|
|
|
>将 $\lambda_2=-2$ 代入 $(\lambda E-A)\boldsymbol x=\boldsymbol0$ 并求解得
|
|
|
|
|
>$-2E-A=\begin{bmatrix}-4&2&0\\2&-3&-2\\0&-2&-2\end{bmatrix}\to \begin{bmatrix}1&0&\frac{1}{2}\\0&1&1\\0&0&0\end{bmatrix}$
|
|
|
|
|
>故对应 $\lambda_2=-2$ 的特征向量为 $\xi_2=(-1,-2,2)^\mathrm T$;
|
|
|
|
|
>将 $\lambda_3=4$ 代入 $(\lambda E-A)\boldsymbol x=\boldsymbol0$ 并求解得
|
|
|
|
|
>$4E-A=\begin{bmatrix}2&2&0\\2&3&-2\\0&-2&4\end{bmatrix}\to \begin{bmatrix}1&0&2\\0&1&-2\\0&0&0\end{bmatrix}$
|
|
|
|
|
>故对应 $\lambda_2=-2$ 的特征向量为 $\xi_3=(-2,2,1)^\mathrm T$;
|
|
|
|
|
>故 $Q_0=\begin{bmatrix}\xi_1&\xi_2&\xi_3\end{bmatrix}=\begin{bmatrix}2&-1&-2\\1&-2&2\\2&2&1\end{bmatrix}$
|
|
|
|
|
>单位化得 $Q=\dfrac{1}{3}Q_0=\dfrac{1}{3}\begin{bmatrix}2&-1&-2\\1&-2&2\\2&2&1\end{bmatrix}$
|
|
|
|
|
>(2) $\|\boldsymbol x\| = 2\to\|\boldsymbol y\| = 2$
|
|
|
|
|
>又 $f(x_1,x_2,x_3)=y_{1}^{2} - 2y_{2}^{2} + 4y_{3}^{2}$,
|
|
|
|
|
>则当 $\boldsymbol y=(0,0,2)^\mathrm T$ 时,$f(x_1,x_2,x_3)=16$ 取得最大值,此时 $\boldsymbol x=Q\boldsymbol y=-\frac{2}{3}(-2,2,1)^\mathrm T$.
|
|
|
|
|
|
|
|
|
|
>[!done] 思考题结论
|
|
|
|
|
>“保持几何度量”体现在代数中最直观常用的就是变换后向量长度不变。
|
|
|
|
|
>>证明:对于正交矩阵 $P$,若 $\boldsymbol x=P\boldsymbol y$ $\|\boldsymbol x\|$
|
|
|
|
|
|
|
|
|
|
配方法化标准形考察较少,此方法熟悉即可:
|
|
|
|
|
>[!example] 例题
|
|
|
|
|
>把二次型 $\displaystyle f(x_1,x_2,x_3)=x_1^2+2x_1x_2+2x_1x_3+2x_2^2+6x_2x_3+100x_3^2$ 通过配方法化为标准形。
|
|
|
|
|
|
|
|
|
|
>[!note] 解:
|
|
|
|
|
>$\displaystyle f=(x_1+x_2+x_3)^2+(x_2+2x_3)^3+95{x_3}^2$,令 $\displaystyle y_1=x_1+x_2+x_3,y_2=x_2+2x_3,y_3=x_3$,得 $\displaystyle f={y_1}^2+{y_2}^2+95{y_3}^2$.
|
|
|
|
|
>注:配方法主要要注意,第一次配要把$x_1$ 配干净,即在括号外面没有含 $x_1$ 的项,第二次就是 $x_2$,以此类推。
|
|
|
|
|
|
|
|
|
|
但上文提到的均是针对已知二次型的,如果题目给的二次型是一个抽象的,就需要更加灵活地运用不同的方法。
|
|
|
|
|
##### 抽象二次型
|
|
|
|
|
|
|
|
|
|
>[!example] 例题
|
|
|
|
|
>证明:已知实二次型 $\displaystyle f(x_1,x_2,x_3,x_4)=\boldsymbol x^T\boldsymbol A \boldsymbol x$ 中,$\displaystyle \boldsymbol A^T=\boldsymbol A,\boldsymbol A$ 的各行元素之和等于 $6$ ,$\boldsymbol A$ 的秩等于 $1$,则 $\displaystyle f(x_1,x_2,x_3)$ 在正交变换 $\boldsymbol x=\boldsymbol{Cy}$ 作用下可得到标准型 $6y_1^2$.
|
|
|
|
|
|
|
|
|
|
>[!note] 证明:
|
|
|
|
|
>$\boldsymbol A$ 的各行元素之和等于 $6$,即 $\boldsymbol A\begin{bmatrix}1\\1\\1\end{bmatrix}=\begin{bmatrix}6\\6\\6\end{bmatrix}=6\begin{bmatrix}1\\1\\1\end{bmatrix}$,于是 $6$ 是矩阵 $\boldsymbol A$ 对应向量 $\begin{bmatrix}1\\1\\1\end{bmatrix}$ 的特征值,其代数重数至少为 $1$。
|
|
|
|
|
>又 $\boldsymbol A$ 的秩为 $1$,所以齐次线性方程组 $\boldsymbol{Ax}=\boldsymbol 0$ 解空间的维数是 $2$,故 $0$ 也是矩阵 $\boldsymbol A$ 的特征值,几何重数为 $2$,代数重数也至少为 $2$。由上可知,矩阵 $\boldsymbol A$ 的特征值为 $6,0,0$,故二次型 $f$ 可以由正交变换得到标准型 $6y_1^2$.
|
|
|
|
|
|
|
|
|
|
>[!done] 总结
|
|
|
|
|
> 这道题的关键就在于怎么理解 “$\boldsymbol A$ 的各行元素之和等于 $6$” ,如果能正确地翻译这个条件,那这道题就迎刃而解了。至于怎么想到这一点,我可以提供一个思路:对矩阵 $\boldsymbol A$ 右乘一个向量,可以理解为是对 $\boldsymbol A$ 的列向量组进行线性组合;而题目中说各行元素之和为 $6$,这就是说把矩阵的三个列向量加在一起等于 $\begin{bmatrix}6\\6\\6\end{bmatrix}$,这样就能很顺利地解决这道题目了。
|
|
|
|
|
|
|
|
|
|
有的时候,是题目给我们一个正交变换,求原矩阵:
|
|
|
|
|
>[!example] ([[线代2022秋A|2022]])例题
|
|
|
|
|
>已知实二次型 $f(x_{1},x_{2},x_{3})=\boldsymbol{x}^{T}\boldsymbol{A}\boldsymbol{x}$ 在正交变换 $\boldsymbol{x}=\boldsymbol{P}\boldsymbol{y}$ 下的标准形为 $3y_{1}^{2}+3y_{2}^{2}$ ,且 $\boldsymbol{P}$ 的第3列为 $\frac{1}{\sqrt{3}}\begin{bmatrix}1\\1\\1\end{bmatrix}$ ,求 $\boldsymbol{A}$
|
|
|
|
|
|
|
|
|
|
>[!note] 解析
|
|
|
|
|
>由题意可知 $A$ 的特征值为 $\lambda_1=\lambda_2=3,\lambda_3=0$,且 $A$ 对应于特征值
|
|
|
|
|
>$\lambda_3=0$ 的 1 个特征向量为 $\boldsymbol{\alpha}_3=\begin{bmatrix}1\\1\\1\end{bmatrix}$.
|
|
|
|
|
>设 $A$ 对应于特征值 $\lambda_1=\lambda_2=1$ 的特征向量为 $\boldsymbol{\alpha}=\begin{bmatrix}z_1\\z_2\\z_3\end{bmatrix}$,则 $\boldsymbol{\alpha}$与$\boldsymbol{\alpha}_3$ 正交,即满足方程组 $z_1+z_2+z_3=0$,求得该方程组的一个基础解系 $\boldsymbol{\alpha}_1=\begin{bmatrix}-1\\1\\0\end{bmatrix},\boldsymbol{\alpha}_2=\begin{bmatrix}1\\1\\-2\end{bmatrix}$.
|
|
|
|
|
>令 $\boldsymbol{Q}=[\boldsymbol{\alpha}_1\ \boldsymbol{\alpha}_2\ \boldsymbol{\alpha}_3]=\begin{bmatrix}-1&1&1\\1&1&1\\0&-2&1\end{bmatrix}$,则有 $\boldsymbol{Q}^{-1}\boldsymbol{A}\boldsymbol{Q}=\begin{bmatrix}3&0&0\\0&3&0\\0&0&0\end{bmatrix}$.
|
|
|
|
|
>从而$$\boldsymbol{A}=\boldsymbol{Q}\begin{bmatrix}3&0&0\\0&3&0\\0&0&0\end{bmatrix}\boldsymbol{Q}^{-1}=\begin{bmatrix}-1&1&1\\1&1&1\\0&-2&1\end{bmatrix}\begin{bmatrix}3&0&0\\0&3&0\\0&0&0\end{bmatrix}\begin{bmatrix}-\dfrac{1}{2}&\dfrac{1}{2}&0\\\\\dfrac{1}{6}&\dfrac{1}{6}&-\dfrac{1}{3}\\\\\dfrac{1}{3}&\dfrac{1}{3}&\dfrac{1}{3}\end{bmatrix}=\begin{bmatrix}2&-1&-1\\-1&2&-1\\-1&-1&2\end{bmatrix}$$
|
|
|
|
|
|
|
|
|
|
##### 其他类型
|
|
|
|
|
>[!example] 例题
|
|
|
|
|
>已知实二次型 $f(x_1,x_2,x_3)=\boldsymbol x^T \boldsymbol A \boldsymbol x$ 在可逆线性变换 $\begin{bmatrix}x_1\\ x_2\\ x_3\end{bmatrix}=\begin{bmatrix}1& 2&2\\0&1&2\\0&2&1\end{bmatrix}\begin{bmatrix}y_1\\ y_2\\ y_3\end{bmatrix}$ 的作用下得到标准型 $\displaystyle 4y_1^2-\frac{1}{2}y_2^2$,则二次型 $f(x_1,x_2,x_3)$ 在可逆线性变换 $\begin{bmatrix}x_1\\x_2\\x_3\end{bmatrix}=\begin{bmatrix}-2 & -1 & 2\\-1 & 0 & 2\\-2 & 0 & 1\end{bmatrix}\begin{bmatrix}z_1\\z_2\\z_3\end{bmatrix}$ 的作用下可以得到标准型$\underline{\qquad}$.
|
|
|
|
|
|
|
|
|
|
>[!note] 解:
|
|
|
|
|
>记 $\boldsymbol x=(x_1,x_2,x_3)^T,\boldsymbol y=(y_1,y_2,y_3)^T,\boldsymbol z=(z_1,z_2,z_3)^T,\boldsymbol C=\begin{bmatrix}1&2&2\\0&1&2\\0&2&1\end{bmatrix}$,
|
|
|
|
|
>解法一: $\boldsymbol x=\boldsymbol{Cy},\boldsymbol x=\boldsymbol C\begin{bmatrix}0&-1&0\\-1&0&0\\0&0&1\end{bmatrix}\boldsymbol z$,从而$$\boldsymbol x=\boldsymbol C\begin{bmatrix}0&-1&0\\-1&0&0\\0&0&1\end{bmatrix}\begin{bmatrix}z_1\\z_2\\z_3\end{bmatrix}=\boldsymbol C\begin{bmatrix}-z_2\\-z_1\\z_3\end{bmatrix},$$于是此变换下标准型为$\displaystyle f(x_1,x_2,x_3)=4(-z_2)^2-\frac{1}{2}(-z_1)^2=-\frac{1}{2}z_1^2+4z_2^2.$
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
##### 正定性
|
|
|
|
|
通常而言,我们目前能接触到的正定性相关题目需要从正定性的定义出发
|
|
|
|
|
|
|
|
|
|
正定/负定的定义及相关的反映
|
|
|
|
|
对于对称矩阵 $A\in\mathbb{R}^{n\times n}$:
|
|
|
|
|
|
|
|
|
|
| 正定性 | 定义 | 二次型 | 特征值(惯性) |
|
|
|
|
|
| :-: | :---------------------------------------------------------------------------------: | :----: | :-----: |
|
|
|
|
|
| 正定 | $\forall\boldsymbol x\in\mathbb{R}^n\backslash\{\boldsymbol 0\}, x^\mathrm TAx>0$ | 恒大于零 | 全正 |
|
|
|
|
|
| 半正定 | $\forall\boldsymbol x\in\mathbb{R}^n\backslash\{\boldsymbol 0\}, x^\mathrm TAx\ge0$ | 恒大于等于零 | 全非负 |
|
|
|
|
|
| 半负定 | $\forall\boldsymbol x\in\mathbb{R}^n\backslash\{\boldsymbol 0\}, x^\mathrm TAx\le0$ | 恒小于等于零 | 全非正 |
|
|
|
|
|
| 负定 | $\forall\boldsymbol x\in\mathbb{R}^n\backslash\{\boldsymbol 0\}, x^\mathrm TAx<0$ | 恒小于零 | 全负 |
|
|
|
|
|
| 不定 | 上述都不满足 | 不定 | 有正有负 |
|
|
|
|
|
在正定性的判别中,还有顺序主子式判别法.....%%TODO: COMPLETE THIS%%
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
>[!example] 例题
|
|
|
|
|
>证明:已知 $n$ 阶方阵 $\boldsymbol A$ 的特征值全大于 $0$, $\boldsymbol B$ 为 $n$ 半正定矩阵,则对任意 $k>0,l\ge0$,$k\boldsymbol A+l\boldsymbol B$ 正定.
|
|
|
|
|
|
|
|
|
|
>[!note] 证明:
|
|
|
|
|
>由题意,$\boldsymbol A$ 正定,于是 $\boldsymbol x^T\boldsymbol A\boldsymbol x>0,\boldsymbol x\neq\boldsymbol 0$;$\boldsymbol B$ 正定,于是 $\boldsymbol x^T\boldsymbol B\boldsymbol x\ge0,\boldsymbol x\neq\boldsymbol 0$. 则 $\boldsymbol x^T(k\boldsymbol A+l\boldsymbol B)\boldsymbol x=k\boldsymbol x^T\boldsymbol A\boldsymbol x+l\boldsymbol x^T\boldsymbol B\boldsymbol x>0$,于是由定义,$k\boldsymbol A+l\boldsymbol B$ 正定.
|
|
|
|
|
|
|
|
|
|
>[!example] 例题
|
|
|
|
|
>已知 $n$ 阶实对称矩阵 $A$ 为正定矩阵, $n$ 阶实矩阵 $B$ 使得 $A-B^\text{T}AB$ 也为正定矩阵,证明 $B$ 的特征值 $\lambda$ 满足关系式 $|\lambda|<1$.
|
|
|
|
|
|
|
|
|
|
>[!note] 证明:
|
|
|
|
|
>由于 $A$ 为正定矩阵,所以对任意 $\boldsymbol x\neq\boldsymbol 0,$ 有 $\boldsymbol x^\text{T}A\boldsymbol x>0.$
|
|
|
|
|
>考虑矩阵 $B$ 对应特征值 $\lambda$ 的特征向量 $\boldsymbol p\neq\boldsymbol 0$, 则由特征值的定义知 $B\boldsymbol p=\lambda\boldsymbol p$. 由正定性可知 $$\begin{aligned}\boldsymbol p^\text{T}(A-B^\text{T}AB)\boldsymbol p&=\boldsymbol p^\text{T}A\boldsymbol p-\boldsymbol p^\text{T}B^\text{T}AB\boldsymbol p\\&=\boldsymbol p^\text{T}A\boldsymbol p-(B\boldsymbol p)^\text{T}A(B\boldsymbol p)\\&=(1-\lambda^2)\boldsymbol p^\text{T}A\boldsymbol p>0\end{aligned}.$$于是 $1-\lambda^2>0$,即 $|\lambda|<1$.
|
|
|
|
|
|
|
|
|
|
也有不少题需要用到正定性的性质,需要多加注意:
|
|
|
|
|
>[!example] 例题
|
|
|
|
|
>证明:已知实二次型 $\displaystyle f(x_1,x_2,x_3,x_4)=\boldsymbol x^T\boldsymbol A \boldsymbol x$ 中,$\displaystyle \boldsymbol A^T=\boldsymbol A, |\boldsymbol A|<0,$ 则必存在非零向量 $\displaystyle\boldsymbol c=(c_1,c_2,c_3,c_4)^T$,使得 $\displaystyle f(c_1,c_2,c_3,c_4)=0$.
|
|
|
|
|
|
|
|
|
|
>[!note] 证明:
|
|
|
|
|
>设 $\displaystyle \boldsymbol A$ 的特征值分别为 $\lambda_1,\lambda_2,\lambda_3,\lambda_4$,则有 $|\boldsymbol A|=\lambda_1\lambda_2\lambda_3\lambda_4<0$,故四个特征值中有奇数个负数,故必定有正有负,从而二次型 $f$ 是不定的,故存在非零向量 $\displaystyle\boldsymbol c=(c_1,c_2,c_3,c_4)^T$,使得 $\displaystyle f(c_1,c_2,c_3,c_4)=0$.
|
|
|
|
|
|
|
|
|
|
>[!example] 例题
|
|
|
|
|
>$t$ 为何值时,二次型 $f(x_1,x_2,x_3,x_4)=x_1^2+x_2^2+x_3^2+3tx_4^2+tx_1x_2+2tx_3x_4$ 是正定的?
|
|
|
|
|
|
|
|
|
|
>[!note] 解:
|
|
|
|
|
>二次型对应的矩阵为 $A=\begin{bmatrix}1 & \dfrac{t}{2} & 0 & 0 \\[6pt]\dfrac{t}{2} & 1 & 0 & 0 \\[6pt]0 & 0 & 1 & t \\[6pt]0 & 0 & t & 3t\end{bmatrix}.$ 由于二次型是正定的,故其矩阵的顺序主子式均大于零,所以$$\begin{vmatrix} 1 & \dfrac{t}{2} \\ \dfrac{t}{2} & 1 \end{vmatrix} = 1 - \dfrac{t^2}{4}>0,\begin{vmatrix}1 & \dfrac{t}{2} & 0 \\\dfrac{t}{2} & 1 & 0 \\0 & 0 & 1\end{vmatrix}=1-\dfrac{t^2}{4}>0,$$
|
|
|
|
|
>$$|A|=\begin{vmatrix}1 & \dfrac{t}{2} & 0 & 0 \\[6pt]\dfrac{t}{2} & 1 & 0 & 0 \\[6pt]0 & 0 & 1 & t \\[6pt]0 & 0 & t & 3t\end{vmatrix}=(1 - \dfrac{t^2}{4})(3t-t^2)>0,$$故 $0<t<2.$
|