正交及二次型

develop
Cym10x 3 months ago
parent 782c709d28
commit 8dcc57edfd

@ -137,65 +137,57 @@ $$\boldsymbol{\varepsilon}_3=\dfrac{\boldsymbol{\alpha}_1+2\boldsymbol{\alpha}_2
## 二次型
二次型,顾名思义,就是二次函数,只不过是 $n$ 元函数,当元数比较小时,我们可以清楚地画出它的图像,判断其正负性,然而一旦维度升高,我们是无法想象其空间几何构型的,只能从代数的角度了解其性质。因此引入二次型矩阵的概念,通过描述矩阵性质,进而得出函数的性质。
二次型,顾名思义,就是二次函数,只不过是 $n$ 元函数,当元数比较小时,我们可以清楚地画出它的图像,判断其几何形状,推得相应对的性质,然而一旦维度升高,我们是无法想象其空间几何构型的,只能从代数的角度了解其性质。因此引入二次型矩阵的概念,通过描述矩阵性质,进而得出函数的性质。
首先,需要注意的是,二次型矩阵是人为定义的矩阵(只要满足一一对应就可以),为了更好的性质,我们选择了实对称矩阵作为描述对象。
首先,需要注意的是,二次型矩阵是人为定义的矩阵(只要满足一一对应就可以),为了更好的性质,我们选择了**实对称矩阵**作为描述对象。
二次型中有许多 $x_ix_j$ 的交叉项,它会影响我们对函数正负的判断,而在矩阵上也就对应非对角线元素,我们想通过换元将交叉项消掉,只留下平方项。对应换元用线性代换思想描述就是 $\boldsymbol{X=CY}$ ,其中 $\boldsymbol C$ 可逆,然后也就是说 $f=\boldsymbol x^\mathrm T\boldsymbol A\boldsymbol x=(\boldsymbol C\boldsymbol Y)^\mathrm T\boldsymbol A(\boldsymbol C\boldsymbol Y)=\boldsymbol y^\mathrm T(\boldsymbol C^\mathrm T\boldsymbol A\boldsymbol C)\boldsymbol y$ ,视 $\boldsymbol Y$ 为新的变元,其对应的矩阵为 $\boldsymbol C^\mathrm T\boldsymbol A\boldsymbol C$,由于 $\boldsymbol C$ 是可逆变换,我们研究 $\boldsymbol y$,倒推回去就是研究 $\boldsymbol x$,(注意:可逆是非常重要的,并且经常被忽略),记 $\boldsymbol B=\boldsymbol C^\mathrm T\boldsymbol A\boldsymbol C$,回到最初想法“想通过换元将交叉项消掉,只留下平方项’’,换言之,通过找 $\boldsymbol C$ ,使得 $\boldsymbol B$ 变成对角阵。这也是贯穿二次型章节的一个重要问题。
二次型中有许多 $x_ix_j$ 的交叉项,它会影响我们对函数正负的判断,而在矩阵上也就对应非对角线元素,我们想通过换元将交叉项消掉,只留下平方项。对应换元用线性代换思想描述就是 $\boldsymbol x=C\boldsymbol y$ ,其中 $C$ 可逆,然后也就是说 $f=\boldsymbol x^\mathrm TA\boldsymbol x=(C\boldsymbol y)^\mathrm TA(C\boldsymbol y)=\boldsymbol y^\mathrm T(C^\mathrm TAC)\boldsymbol y$ ,视 $\boldsymbol y$ 为新的变元,其对应的矩阵为 $C^\mathrm TAC$,由于 $C$ 是可逆变换,我们研究 $\boldsymbol y$,倒推回去就是研究 $\boldsymbol x$,(注意:可逆是非常重要的,并且经常被忽略),记 $B=C^\mathrm TAC$,回到最初想法“想通过换元将交叉项消掉,只留下平方项’’,换言之,通过找 $C$ ,使得 $B$ 变成对角阵。这也是贯穿二次型章节的一个重要问题。
我们称换元后得到只含平方项的函数为标准型,平方项前面的系数随便取,显然,标准型是无穷多的,因为换元是千奇百怪的。
我们称换元后得到只含平方项的函数为标准型,平方项前面的系数,只要不变号,就能随便取,显然,标准型是无穷多的,因为换元是千奇百怪的。
继续抽丝剥茧,称只含平方项的二次函数,且平方项系数只为1-1或0的为规范性一个二次型的规范型是唯一的。
继续抽丝剥茧,称只含平方项的二次函数,且平方项系数只为 $1$ $-1$ 或 $0$ 的为规范形,一个二次型的规范形是唯一的。
规范型的唯一性恰是二次型最核心的代数本质体现——无论我们选取何种可逆线性代换无论中间的标准型如何千变万化二次型中平方项系数为1、-1的项的个数始终固定不变这两个固定的个数便分别被称为二次型的**正惯性指数**与**负惯性指数**而系数为0的项的个数自然就是变元个数与正、负惯性指数之和的差值。
规范型的唯一性,恰是二次型最核心的代数本质体现——二次型的惯性。无论我们选取何种可逆线性代换,无论中间的标准型如何千变万化,二次型中平方项系数为 $1$$-1$ 的项的个数始终固定不变,这两个固定的个数,便分别被称为二次型的**正惯性指数**与**负惯性指数**,而系数为 $0$ 的项的个数,自然就是变元个数与正、负惯性指数之和的差值。
这一不变性并非偶然,而是由“惯性定理”严格保证的:任意一个实二次型,都可以通过可逆线性代换化为唯一的规范型,其正、负惯性指数是二次型本身固有的属性,与所选的线性代换无关。换句话说,惯性指数是二次型的“不变量”,它深刻反映了二次型在可逆变换下的本质特征,就像物体的质量一样,不随坐标系的转换而改变。而我们常用的化二次型为标准型的方法有正交变换法、配方法,本质上都依托可逆线性代换,与合同变换紧密关联,这些方法的步骤、特点及与惯性定理的关联,存在明确区别与内在联系,具体可梳理如下:
#### (一)配方法(可逆线性代换,最通用便捷)
配方法通过代数配方手段消去交叉项,直接构造可逆线性代换 $X=CY$ ,将二次型化为标准型,无需依赖矩阵的特征值、特征向量,适用所有实二次型。
**核心步骤**
配方法通过代数配方手段消去交叉项,直接构造可逆线性代换 $\boldsymbol x=C\boldsymbol y$ ,将二次型化为标准型,无需依赖矩阵的特征值、特征向量,适用所有实二次型。
1.若二次型含某变量的平方项(如 $x_1^2$ ),先将含 $x_1$ 的所有项归并,配成完全平方,消去含 $x_1$ 的交叉项;
>[!tip] 核心步骤:
>1.若二次型含某变量的平方项(如 $x_1^2$ ),先将含 $x_1$ 的所有项归并,配成完全平方,消去含 $x_1$ 的交叉项;
>2.对剩余变量重复上述步骤,直至所有交叉项消去,得到仅含平方项的标准型;
>3.反向推导得到可逆线性代换 $\boldsymbol x=C\boldsymbol y$ ,对应的矩阵变换为 $C^TAC=\Lambda$ $\Lambda$ 为对角阵,对角元为标准型系数)。
2.对剩余变量重复上述步骤,直至所有交叉项消去,得到仅含平方项的标准型;
**特点**:操作简单、计算量小,可灵活构造代换矩阵 $C$;但标准型系数不唯一(随配方方式变化),且 $C$ 不一定是正交矩阵,变换不保持几何度量(如长度、夹角)。
#### **(二)合同变换法(直接作用于矩阵,直观体现合同关系)**
3.反向推导得到可逆线性代换 $X=CY$ ,对应的矩阵变换为 $C^TAC=\Lambda$ $\Lambda$ 为对角阵,对角元为标准型系数)
合同变换法直接对实对称矩阵 $A$ 进行初等变换,通过“初等行变换+同步初等列变换”,将 $A$ 化为对角阵 $\Lambda$ ,同步记录初等列变换得到可逆矩阵 $C$,本质是直接构造 $C^TAC=\Lambda$
**特点**操作简单、计算量小可灵活构造代换矩阵C但标准型系数不唯一随配方方式变化且C不一定是正交矩阵变换不保持几何度量如长度、夹角
>[!tip] 核心步骤:
>1. 构造分块矩阵 $\begin{bmatrix}A\\I\end{bmatrix}$ I为单位矩阵
>2. 对 $A$ 施行初等行变换的同时,对整个分块矩阵的列施行相同的初等列变换,使 $A$ 化为对角阵 $\Lambda$
>3. 此时下方单位矩阵I同步化为可逆矩阵 $C$,满足 $C^TAC=\Lambda$ ,对应线性代换 $X=CY$ ,二次型化为标准型 $f=\Lambda_{11}y_1^2+\Lambda_{22}y_2^2+...+\Lambda_{nn}y_n^2$ 。
**特点**:直接关联矩阵合同关系,**直观体现二次型化标准型的本质**标准型系数不唯一C由初等变换直接得到适用于需明确合同矩阵的场景计算量介于配方法与正交变换法之间。
#### (三)**正交变换法(特殊可逆代换,保几何度量)**
#### (四)**正交变换法利用实对称矩阵可正交对角化的性质构造正交矩阵Q满足 $Q^T=Q^{-1}$ ),使 $Q^TAQ=\Lambda$ ,其中 $\Lambda$ 的对角元为A的特征值对应的线性代换 $X=QY$ 为正交变换。**
**核心步骤**
1求二次型对应实对称矩阵 $A$ 的全部特征值 $\lambda_1,\lambda_2,...,\lambda_n$
对每个特征值,求对应的特征向量,并将属于同一特征值的特征向量正交化;
2将所有正交化后的特征向量单位化得到正交矩阵 $Q$
3作正交变换 $X=QY$ ,二次型化为标准型 $f=\lambda_1y_1^2+\lambda_2y_2^2+...+\lambda_ny_n^2$ 。
正交变换法利用实对称矩阵可正交对角化的性质构造正交矩阵Q满足 $Q^T=Q^{-1}$ ),使 $Q^TAQ=\Lambda$ ,其中 $\Lambda$ 的对角元为A的特征值对应的线性代换 $X=QY$ 为正交变换。
>[!tip] 核心步骤:
>1.求二次型对应实对称矩阵 $A$ 的全部特征值 $\lambda_1,\lambda_2,...,\lambda_n$
>对每个特征值,求对应的特征向量,并将属于同一特征值的特征向量正交化;
>2.将所有正交化后的特征向量单位化,得到正交矩阵 $Q$
>3作正交变换 $X=QY$ ,二次型化为标准型$f=\lambda_1y_1^2+\lambda_2y_2^2+...+\lambda_ny_n^2$ 。
**特点**:标准型系数为 $A$ 的特征值,具有唯一性(不计顺序);正交变换保持向量长度、夹角不变,几何意义明确(如旋转、反射变换);但计算量较大,需求解特征值和特征向量。
#### **(四)合同变换法(直接作用于矩阵,直观体现合同关系)**
合同变换法直接对实对称矩阵 $A$ 进行初等变换,通过“初等行变换+同步初等列变换”,将 $A$ 化为对角阵 $\Lambda$ ,同步记录初等列变换得到可逆矩阵 $C$,本质是直接构造 $C^TAC=\Lambda$ 。
**核心步骤**
1构造分块矩阵 $\begin{bmatrix}A\\I\end{bmatrix}$ I为单位矩阵
2对 $A$ 施行初等行变换的同时,对整个分块矩阵的列施行相同的初等列变换,使 $A$ 化为对角阵 $\Lambda$
3此时下方单位矩阵I同步化为可逆矩阵 $C$,满足 $C^TAC=\Lambda$ ,对应线性代换 $X=CY$ ,二次型化为标准型 $f=\Lambda_{11}y_1^2+\Lambda_{22}y_2^2+...+\Lambda_{nn}y_n^2$ 。
**特点**直接关联矩阵合同关系直观体现二次型化标准型的本质标准型系数不唯一C由初等变换直接得到适用于需明确合同矩阵的场景计算量介于配方法与正交变换法之间。、方法间核心区别与关联
**区别**1. 本质不同:正交变换法是特殊的合同变换( $Q$ 为正交矩阵, $Q^T=Q^{-1}$ 配方法、合同变换法是一般合同变换2. 标准型系数正交变换法系数为特征值唯一不计顺序其余两种方法系数任意3. 几何意义仅正交变换保度量其余两种无几何约束4. 计算复杂度:配方法最简,正交变换法最繁。
#### 方法间核心区别与关联
| 方法 | 配方法 | 合同变换法 | 正交变换法 |
| :---: | :----: | :----: | :----------------: |
| 本质 | 一般合同变换 | 一般合同变换 | 正交合同变换,变换矩阵为正交矩阵 |
| 标准型系数 | 仅保持惯性 | 仅保持惯性 | 特征值 |
| 计算复杂度 | 低 | 中 | 高 |
| 几何意义 | 无几何约束 | 无几何约束 | 保持几何度量(变换后图形形状不改变) |
**关联**:所有方法均基于可逆线性代换,本质都是矩阵的合同对角化;无论哪种方法得到的标准型,其正、负惯性指数均由惯性定理保证恒定,最终都可通过进一步代换化为唯一的规范型。
@ -206,7 +198,7 @@ $$\boldsymbol{\varepsilon}_3=\dfrac{\boldsymbol{\alpha}_1+2\boldsymbol{\alpha}_2
>证明:$B=P^\mathrm TAP \Rightarrow B^\mathrm T=(P^\mathrm TAP)^\mathrm T=P^\mathrm TA^\mathrm TP=P^\mathrm TAP$,即 $B^\mathrm T=B$
>[!example] 例题
>已知三阶实对称矩阵 $A$ 与 $\begin{bmatrix}2&0&0\\0&1&0\\0&0&-3\end{bmatrix}$ 相似,则下列矩阵中,与 $\boldsymbol A$ 相似但不合同的是
>已知三阶实对称矩阵 $A$ 与 $\begin{bmatrix}2&0&0\\0&1&0\\0&0&-3\end{bmatrix}$ 相似,则下列矩阵中,与 $A$ 相似但不合同的是
>A. $\begin{bmatrix}1&1&1\\1&1&1\\1&1&1\end{bmatrix}\qquad$ B. $\begin{bmatrix}-3&0&0\\0&1&0\\0&0&2\end{bmatrix}\qquad$ C. $\begin{bmatrix}-3&1&1\\0&1&1\\0&0&2\end{bmatrix}\qquad$ D. $\begin{bmatrix}1&0&0\\0&-2&0\\0&0&3\end{bmatrix}$
>[!note] 解析

Loading…
Cancel
Save