|
|
|
|
@ -0,0 +1,576 @@
|
|
|
|
|
# Section 1 向量空间与线性空间
|
|
|
|
|
|
|
|
|
|
在讲线性空间之前,必须先复习一下向量空间的知识,这是必要的,因为线性空间与向量空间之间有某种“联系”,这种联系叫做“同构”。
|
|
|
|
|
|
|
|
|
|
>[!info] 定义1$\qquad$向量空间
|
|
|
|
|
>设$V$是数域$\mathbb{F}$上的$n$维向量构成的非空集合,如果$V$对于向量加法及数乘两种运算封闭,即
|
|
|
|
|
>(1)对任意的$\boldsymbol{\alpha}\in V,\boldsymbol{\beta}\in V$,有$\boldsymbol{\alpha}+\boldsymbol{\beta}\in V$;
|
|
|
|
|
>(2)对任意的$\boldsymbol{\alpha}\in V,k\in \mathbb{F}$,有$k\boldsymbol{\alpha}\in V$,
|
|
|
|
|
>那么称集合$V$为数域$\mathbb{F}$上的**向量空间**.若$\mathbb{F}$为实(复)数域,则称$V$为**实(复)向量空间**.
|
|
|
|
|
|
|
|
|
|
一般地,由向量 $\boldsymbol{\alpha}_1,\boldsymbol{\alpha}_2,\cdots,\boldsymbol{\alpha}_n$ **生成的向量空间**定义为 $\boldsymbol{\alpha}_1,\boldsymbol{\alpha}_2,\cdots,\boldsymbol{\alpha}_n$ 的一切线性组合所构成的集合,记作 $\mathrm{span}(\boldsymbol{\alpha}_1,\boldsymbol{\alpha}_2,\cdots,\boldsymbol{\alpha}_n)$,即$$\text{span}(\boldsymbol{\alpha}_1,\boldsymbol{\alpha}_2,\cdots,\boldsymbol{\alpha}_n)=\{k_1\boldsymbol{\alpha}_1+k_2\boldsymbol{\alpha}_2+\cdots+k_n\boldsymbol{\alpha}_n|k_1,k_2,\cdots,k_n\in\mathbb{R}\}.$$
|
|
|
|
|
>[!info] 定义2$\qquad$子空间
|
|
|
|
|
>设$U,V$都是同一数域上的向量空间,若$U\subseteq V$,则称$U$为$V$的子空间.
|
|
|
|
|
|
|
|
|
|
向量空间的**基**和**维数**等概念就不在这里具体定义,不然讲义会变得相当繁琐。但建议大家自己去看一看书上的相关定义,这是必要的。
|
|
|
|
|
这里有一个小结论:
|
|
|
|
|
>[!info] 定理
|
|
|
|
|
>设空间 $V$ 有一个子空间 $W$ ,如果 $W$ 的维数等于 $V$ 的维数,那么 $W=V$.
|
|
|
|
|
|
|
|
|
|
>[!note] 证明:
|
|
|
|
|
>设维数等于 $n$ ,则空间 $W$ 中能取出 $n$ 个线性无关的向量作为基。而 $V$ 的维数也是 $n$,所以 $V$ 的基也只有 $n$ 个向量,所以刚刚取出来的那 $n$ 个向量也是$V$ 的基,故 $W=V$.
|
|
|
|
|
|
|
|
|
|
>[!warning] 有以下几个点需要注意:
|
|
|
|
|
>1. 零空间$\displaystyle\{\boldsymbol{0}\}$没有基;
|
|
|
|
|
>2. 一般来说,向量空间的基是不唯一的;
|
|
|
|
|
>3. 等价的向量组生成的向量空间是相同的;
|
|
|
|
|
>4. 向量空间的维数与向量的维数是两个不同的概念
|
|
|
|
|
|
|
|
|
|
如果向量组 $T:\boldsymbol{\alpha}_1,\boldsymbol{\alpha}_2,\cdots,\boldsymbol{\alpha}_n$ 是向量空间$\displaystyle V$的一组基,则对任意$\boldsymbol{\beta}\in V$,有$$\boldsymbol{\beta}=x_1\boldsymbol{\alpha}_1+x_2\boldsymbol{\alpha}_2+\cdots+x_n\boldsymbol{\alpha}_n,x_1,x_2,\cdots,x_n\in\mathbb{R},$$若用矩阵乘法的形式,则可以写成$$\boldsymbol{\beta}=\begin{bmatrix}\boldsymbol{\alpha}_1\ \boldsymbol{\alpha}_2\ \cdots\ \boldsymbol{\alpha}_n\end{bmatrix}\begin{bmatrix}x_1\\x_2\\\vdots\\x_n\end{bmatrix}=\begin{bmatrix}\boldsymbol{\alpha}_1\ \boldsymbol{\alpha}_2\ \cdots\ \boldsymbol{\alpha}_n\end{bmatrix}\boldsymbol{x},\boldsymbol{x}\in\mathbb{R}^n,$$称 $\boldsymbol{x}$ 为向量 $\boldsymbol{\beta}$ 在基 $T$ 下的坐标.特别地,如果取基$$\mathcal{E}:\boldsymbol{e}_1,\boldsymbol{e}_2,\cdots,\boldsymbol{e}_n,\boldsymbol{e}_i=\begin{bmatrix}\vdots\\1\\\vdots\end{bmatrix}\in\mathbb{R}^n,\text{其中1在第}i\text{行},$$则 $\boldsymbol{\beta}$ 在基 $\mathcal{E}$ 下的坐标就是它本身.
|
|
|
|
|
既然基是不唯一的,那么会有一个问题:不同的基之间有什么关系呢?
|
|
|
|
|
我们取向量空间$V$的两组基 $\displaystyle T_1:\boldsymbol{\alpha}_1,\boldsymbol{\alpha}_2,\cdots,\boldsymbol{\alpha}_n$ 和 $\displaystyle T_2:\boldsymbol{\beta}_1,\boldsymbol{\beta}_2,\cdots,\boldsymbol{\beta}_n$ .由于 $T_1$ 是一组基,向量组 $T_2$ 中的每个向量肯定可以唯一地用 $T_1$ 来表示,即$$\boldsymbol{\beta}_i=k_{i1}\boldsymbol{\alpha}_1+k_{i2}\boldsymbol{\alpha}_2+\cdots+k_{in}\boldsymbol{\alpha}_n,k_{ij}\in\mathbb{R},i,j=1,2,\cdots,n.$$故$$\begin{bmatrix}
|
|
|
|
|
\boldsymbol{\beta}_1\ \cdots\ \boldsymbol{\beta}_n
|
|
|
|
|
\end{bmatrix}
|
|
|
|
|
=\begin{bmatrix}
|
|
|
|
|
\boldsymbol{\alpha}_1\ \cdots\ \boldsymbol{\alpha}_n
|
|
|
|
|
\end{bmatrix}
|
|
|
|
|
\begin{bmatrix}
|
|
|
|
|
k_{11} & k_{12} & \cdots & k_{1n}\\
|
|
|
|
|
k_{21} & k_{22} & \cdots & k_{2n}\\
|
|
|
|
|
\vdots & \vdots & \ddots & \vdots\\
|
|
|
|
|
k_{n1} & k_{n2} & \cdots & k_{nn}
|
|
|
|
|
\end{bmatrix}
|
|
|
|
|
=\begin{bmatrix}
|
|
|
|
|
\boldsymbol{\alpha}_1\ \cdots\ \boldsymbol{\alpha}_n
|
|
|
|
|
\end{bmatrix}\boldsymbol{K},
|
|
|
|
|
$$称矩阵 $\boldsymbol{K}$ 为基 $T_1$ 到基 $T_2$ 的**过渡矩阵**.由推导过程知过渡矩阵是存在且唯一的,也显然是可逆的(否则向量组 $T_2$ 就会线性相关,与它是一组基矛盾).同时,我们还要考虑同一个向量$\boldsymbol{\gamma}$在两组不同的基下的坐标之间的关系.
|
|
|
|
|
设向量 $\boldsymbol{\gamma}\in V$,且在基 $T_1$ 下的坐标为 $\boldsymbol{x}$,即$\boldsymbol{\gamma}=\begin{bmatrix}\boldsymbol{\alpha}_1\ \cdots\ \boldsymbol{\alpha}_n\end{bmatrix}\boldsymbol{x}\overset{\mathrm{def}}{=}\boldsymbol{Ax}$,若 $\boldsymbol{\gamma}$ 在基 $T_2$ 下的坐标为 $\boldsymbol{y}$ ,则$\boldsymbol{\gamma}=\begin{bmatrix}\boldsymbol{\beta}_1\ \cdots\ \boldsymbol{\beta}_n\end{bmatrix}\boldsymbol{y}\overset{\mathrm{def}}{=}\boldsymbol{By}$,又有$\boldsymbol{B}=\boldsymbol{AK}$,得 $\boldsymbol{\gamma}=\boldsymbol{By}=\boldsymbol{AKy},$ 由于同一个向量在同一组基下的坐标是唯一的,故 $\boldsymbol{x}=\boldsymbol{Ky}$ 或 $\boldsymbol{y}=\boldsymbol{K}^{-1}\boldsymbol{x}.$ <span style="color:ff7777;">注意不要搞错矩阵乘的位置!</span>
|
|
|
|
|
|
|
|
|
|
既然我们已经学了这么多的知识了,那不妨来做几道题试试吧!
|
|
|
|
|
|
|
|
|
|
>[!example] 例题1
|
|
|
|
|
>设$V=\{(x_1,x_2,x_3)^T|x_1+x_2+x_3=0,x_1,x_2,x_3\in\mathbb{R}\}$,证明$V$是一个向量空间,并求出它的一组基.
|
|
|
|
|
|
|
|
|
|
>[!note] **证明:**
|
|
|
|
|
对任意$\boldsymbol{x},\boldsymbol{y}\in V, k\in\mathbb{R}$,记$(1,1,1)=\boldsymbol{\alpha}$,则有$\boldsymbol\alpha\boldsymbol x=\boldsymbol\alpha\boldsymbol y=0,\boldsymbol\alpha(\boldsymbol x+\boldsymbol y)=0$,故$\boldsymbol x+\boldsymbol y,k\boldsymbol x\in V$,即$V$是向量空间.显然$V$中的所有元素就是方程$x_1+x_2+x_3=0$的所有解,而方程的通解为$$\boldsymbol x=k_1\begin{bmatrix}1\\-1\\0\end{bmatrix}+k_2\begin{bmatrix}1\\0\\-1\end{bmatrix},k_1,k_2\in\mathbb R,$$故$V$的基为$\begin{bmatrix}1\\-1\\0\end{bmatrix},\begin{bmatrix}1\\0\\-1\end{bmatrix}.$
|
|
|
|
|
|
|
|
|
|
>[!example] 例题2
|
|
|
|
|
>已知$\mathbb{R}^2$的两组基$\boldsymbol\alpha_1,\boldsymbol\alpha_2$和$\boldsymbol\varepsilon_1,\boldsymbol\varepsilon_2$.求一个非零向量$\boldsymbol\beta\in\mathbb{R}^2$,使得$\boldsymbol\beta$在两组基下有相同的坐标,其中$\boldsymbol\alpha_1=(2,-1)^T,\boldsymbol\alpha_2=(5,-4)^T;\boldsymbol\varepsilon_1=(1,0)^T,\boldsymbol\varepsilon_2=(0,1)^T.$
|
|
|
|
|
|
|
|
|
|
>[!note] **解:**
|
|
|
|
|
>容易得到从后一组基到前一组基的过渡矩阵为$\boldsymbol{C}=\begin{bmatrix}2 & 5\\-1 & -4\end{bmatrix},$设$\boldsymbol\beta$在$\boldsymbol\alpha_1,\boldsymbol\alpha_2$下的坐标为$\boldsymbol y$,则$\boldsymbol y=\boldsymbol C\boldsymbol y\Rightarrow (\boldsymbol C-\boldsymbol E)\boldsymbol y=\boldsymbol 0.$解这个齐次线性方程组得$$\boldsymbol y=k(-5,1)^T,k\in\mathbb{R}.$$
|
|
|
|
|
|
|
|
|
|
好了,现在回到我们的主题:线性空间。先下定义:
|
|
|
|
|
>[!info] 定义3 $\qquad$线性空间
|
|
|
|
|
>设 $V$ 为一非空集合,$\mathbb{F}$ 为一数域. 对于 $V$ 中任意两个元素定义了“加法”运算,记为“+”;对于数域 $\mathbb{F}$ 中的元素与 $V$ 中元素定义“数乘”运算,记为"$\cdot$"(算式中常省略不写). 如果满足对任意 $x,y,z\in V,\lambda,\mu\in\mathbb{F}$,有
|
|
|
|
|
>(1)(封闭性)$V$ 对加法和数乘封闭;
|
|
|
|
|
>(2)(交换律)$x+y=y+x$
|
|
|
|
|
>(3)(加法结合律)$(x+y)+z=x+(y+z)$
|
|
|
|
|
>(4)(零元)存在元素 $0\in V$,使得对任意 $x\in V$ 均有 $0+x=x$
|
|
|
|
|
>(5)(负元)对任意 $x\in V$,存在$y\in V$,使得$x+y=0$
|
|
|
|
|
>(6)(第一分配律)$\lambda(x+y)=\lambda x+\lambda y$
|
|
|
|
|
>(7)(第二分配律)$(\lambda+\mu)x=\lambda x+\mu x$
|
|
|
|
|
>(8)(数乘结合律)$(\lambda\mu)x=\lambda(\mu x)$
|
|
|
|
|
>(9)(数乘单位元)存在 $1\in \mathbb{F}$,使得对任意 $x\in V$,有$1x=x$,
|
|
|
|
|
>则称$V$关于上述运算构成数域 $\mathbb{F}$ 上的**线性空间**,简记为 $(V,\mathbb{F},+,\cdot)$ 是线性空间.
|
|
|
|
|
|
|
|
|
|
这个定义看上去很复杂,其实是很自然的,这一系列的性质都是我们熟悉的向量空间所具有的,这里只是给它一般化了而已。这里的“加法”和“数乘”只是代表两种运算,并不一定就是我们平常所说的加法和乘法。
|
|
|
|
|
和向量空间类似,我们也可以定义线性子空间、基、维数和坐标等概念,也可以讨论线性空间中的基变换和坐标变换,但这里就不一一赘述了。我们主要关注线性空间的基。
|
|
|
|
|
设 $(V,\mathbb{F},+,\cdot)$ 为 $n$ 维线性空间,若 $\mathbb{F}\subseteq\mathbb{R}$ ,则对任意 $\boldsymbol{\alpha}\in V$,若它在某一组基下的坐标为 $\boldsymbol{x}$ ,则所有这种坐标组成的集合是一个 $n$ 维的向量空间 $U$ 。而每一个线性空间中的元素对这一组基都有唯一的一个坐标,我们就可以建立起从 $V$ 到 $U$ 的一个双射 $\varphi: U\rightarrow V,\boldsymbol{x}\mapsto\boldsymbol{\alpha}$。设这组基为$T_1:\boldsymbol{\alpha}_1,\cdots,\boldsymbol{\alpha}_n$,则这个双射 $\varphi$ 就可以写成$$\boldsymbol{\alpha}=\varphi(\boldsymbol{x})=\begin{bmatrix}\boldsymbol{\alpha}_1\ \cdots\ \boldsymbol{\alpha}_n\end{bmatrix}\boldsymbol{x}.$$这样,我们就可以把所有线性空间中的问题通过它的一组基放到一个维数相同的向量空间中去解决。这其实就是**同构**的思想,每一个线性空间都与一个同维的向量空间结构相同,能够保持原来空间中的运算性质。这也是为什么我们要先做一些向量空间的题目。
|
|
|
|
|
|
|
|
|
|
>[!example] 线性空间的几个例子
|
|
|
|
|
> $(1)$ 对任意给定的正整数$m,n,\mathbb{R}^{m\times n}=\{\boldsymbol A=[a_{ij}]_{m\times n}|a_{ij}\in\mathbb{R}\}$关于矩阵加法和数乘构成数域$\mathbb{R}$上的线性空间,成为**实矩阵空间**;
|
|
|
|
|
>
|
|
|
|
|
> $(2)$ 对任意给定的正整数$n$,次数不超过$n$ 的关于文字$x$的一切多项式构成的集合$\boldsymbol P_n[x]=\{a_nx^n+\cdots+a_1x+a_0|a_i\in\mathbb{R},i=0,1,\cdots,n\}$关于多项式加法和数乘构成数域$\mathbb{R}$上的线性空间,称为**多项式空间**。这里$x$可以是实数、复数、方阵,甚至可以是函数、映射,如果能定义出映射之间的乘法(一般可以是复合)和加法运算的话;
|
|
|
|
|
>
|
|
|
|
|
> $(3)$ 设集合$S$为向量空间$V$上所有线性变换的集合。对任意$\sigma,\pi\in S$定义加法和数域$\mathbb{F}$上的数乘分别为:$(\sigma+\pi)(x)=\sigma(x)+\pi(x),(k\sigma)(x)=k\sigma(x)$,则$S$关于上述加法和数乘构成数域$\mathbb{F}$上的线性空间。实际上,由于线性变换与方阵之间有一一对应的关系,我们可以借助矩阵空间来理解$S$这个线性空间。
|
|
|
|
|
|
|
|
|
|
上面第三个例子不要求大家掌握,但前两个还是得清楚的,这是书上明确给了的例子。
|
|
|
|
|
|
|
|
|
|
>[!example] 例题3
|
|
|
|
|
>设$V$是定义与区间$[a,b]$上取正值的所有函数的集合,我们定义$$f\oplus g=f\times g,\lambda \odot f=f^\lambda\qquad(f,g\in V,\lambda\in\mathbb{R}).$$证明:在上述运算下,$V$是实数域$\mathbb{R}$上的线性空间.
|
|
|
|
|
|
|
|
|
|
>[!note] **证明:**
|
|
|
|
|
>加法$\oplus$交换律、结合律显然成立.
|
|
|
|
|
>取常值映射$\text{c}:[a,b]\rightarrow\mathbb{R}^+,x\mapsto 1$,有 $\forall f\in V,(f\oplus\text{c})(x)=f(x)\times\text c(x)=f(x)\times1=f(x),$ 故映射 $\text{c}$ 为零元.
|
|
|
|
|
>对任意$f\in V$,取映射$\displaystyle g\in V:[a,b]\rightarrow\mathbb{R}^+,x\mapsto\frac{1}{f(x)}$,则 $(f\oplus g)(x)=f(x)\times g(x)=1=\text{c}(x)$,故$g$为$f$的负元. 显然负元唯一.
|
|
|
|
|
> 取$\lambda=1$,显然$1\odot f=f^1=f$,故存在数乘单位元.
|
|
|
|
|
$V$显然对上述加法和乘法封闭. 故在上述运算下,$V$是实数域$\mathbb{R}$上的线性空间.
|
|
|
|
|
|
|
|
|
|
$V$ 中的向量之间具有内在联系,例如任意的向量都可以由一组基线性表示,不同基之间也具有基变换的计算公式等。向量之间的联系可以用线性变换来描述,线性变换是线性空间 $V$ 到自身的一种特定映射。
|
|
|
|
|
用一个矩阵左乘一个向量,总能变成另一个向量。例如,用矩阵
|
|
|
|
|
$$
|
|
|
|
|
A= \begin{bmatrix} 1&2&3\\2&4&5 \end{bmatrix}
|
|
|
|
|
$$
|
|
|
|
|
去左乘任意 3 维向量都可以得到一个 2 维向量,该过程可以看作是线性空间 $\mathbb{R}^3$ 到 $\mathbb{R}^2$ 的映射。
|
|
|
|
|
**定义**
|
|
|
|
|
设 $T$ 为线性空间 $U$ 到 $V$ 的映射,若满足:
|
|
|
|
|
1. **可加性**:对任意的 $\boldsymbol{\alpha},\boldsymbol{\beta} \in U$,有 $T(\boldsymbol{\alpha}+\boldsymbol{\beta})=T(\boldsymbol{\alpha})+T(\boldsymbol{\beta})$;
|
|
|
|
|
2. **齐次性**:对任意的 $\boldsymbol{\alpha} \in U$,$k \in \mathbb{R}$,有 $T(k\boldsymbol{\alpha})=kT(\boldsymbol{\alpha})$,
|
|
|
|
|
则称 $T$ 为 $U$ 到 $V$ 的**线性映射**。
|
|
|
|
|
特别地,若 $T$ 是线性空间 $V$ 到 $V$ 的一个线性映射,则称 $T$ 是 $V$ 上的一个**线性变换**。
|
|
|
|
|
|
|
|
|
|
> **注**:可加性和齐次性可以合并为 $T(k\boldsymbol{\alpha}+l\boldsymbol{\beta})=kT(\boldsymbol{\alpha})+lT(\boldsymbol{\beta})$,其中 $k,l \in \mathbb{R}$。
|
|
|
|
|
|
|
|
|
|
>[!info] **定理**
|
|
|
|
|
>设 $V$ 是线性空间,$T$ 是 $V$ 上的线性变换,则有:
|
|
|
|
|
>1. $T(\boldsymbol{0})=\boldsymbol{0}$;
|
|
|
|
|
>2. $T(-\boldsymbol{\alpha})=-T(\boldsymbol{\alpha})$;
|
|
|
|
|
>3. $T(k_1\boldsymbol{\alpha}_1+k_2\boldsymbol{\alpha}_2+\dots+k_m\boldsymbol{\alpha}_m)=k_1T(\boldsymbol{\alpha}_1)+k_2T(\boldsymbol{\alpha}_2)+\dots+k_mT(\boldsymbol{\alpha}_m)$;
|
|
|
|
|
>4. 若 $\boldsymbol{\alpha}_1,\boldsymbol{\alpha}_2,\dots,\boldsymbol{\alpha}_m$ 是 $V$ 中的线性相关向量组,则 $T(\boldsymbol{\alpha}_1),T(\boldsymbol{\alpha}_2),\dots,T(\boldsymbol{\alpha}_m)$ 也是 $V$ 中的线性相关向量组。
|
|
|
|
|
|
|
|
|
|
>[!note] **证明**
|
|
|
|
|
>1. $T(\boldsymbol{0})=T(0\boldsymbol{0})=0T(\boldsymbol{0})=\boldsymbol{0}$。
|
|
|
|
|
>2. 由定义显然成立。
|
|
|
|
|
>3. 由定义显然成立。
|
|
|
|
|
>4. 设存在不全为零的数 $k_1,k_2,\dots,k_m \in \mathbb{F}$,使得
|
|
|
|
|
$$ k_1\boldsymbol{\alpha}_1+k_2\boldsymbol{\alpha}_2+\dots+k_m\boldsymbol{\alpha}_m=\boldsymbol{0}, $$
|
|
|
|
|
则由(1)得
|
|
|
|
|
$$ T(k_1\boldsymbol{\alpha}_1+k_2\boldsymbol{\alpha}_2+\dots+k_m\boldsymbol{\alpha}_m)=T(\boldsymbol{0})=\boldsymbol{0}. $$
|
|
|
|
|
再由(3)得
|
|
|
|
|
$$ k_1T(\boldsymbol{\alpha}_1)+k_2T(\boldsymbol{\alpha}_2)+\dots+k_mT(\boldsymbol{\alpha}_m)=\boldsymbol{0}, $$
|
|
|
|
|
因而 $T(\boldsymbol{\alpha}_1),T(\boldsymbol{\alpha}_2),\dots,T(\boldsymbol{\alpha}_m)$ 线性相关。
|
|
|
|
|
|
|
|
|
|
例题:
|
|
|
|
|
>[!example] 例题4
|
|
|
|
|
设 $V$ 是数域 $\mathbb{F}$ 上的线性空间,$\lambda \in \mathbb{F}$ 是给定的数,$\boldsymbol{\gamma} \in V$ 是给定的向量,定义变换 $T$:$\forall \boldsymbol{\alpha} \in V$,$T(\boldsymbol{\alpha})=\lambda \boldsymbol{\alpha}+\boldsymbol{\gamma}$。
|
|
|
|
|
证明:只有当 $\boldsymbol{\gamma}=\boldsymbol{0}$ 时,$T$ 才是 $V$ 上的线性变换。
|
|
|
|
|
|
|
|
|
|
>[!note] **解析**:
|
|
|
|
|
>任取 $\boldsymbol{\alpha},\boldsymbol{\beta} \in V$ 和 $k,l \in \mathbb{F}$,当 $\boldsymbol{\gamma}=\boldsymbol{0}$ 时,
|
|
|
|
|
>$$T(k\boldsymbol{\alpha}+l\boldsymbol{\beta})=\lambda(k\boldsymbol{\alpha}+l\boldsymbol{\beta})=k\lambda \boldsymbol{\alpha}+l\lambda \boldsymbol{\beta}=kT(\boldsymbol{\alpha})+lT(\boldsymbol{\beta}).$$
|
|
|
|
|
>当 $\boldsymbol{\gamma} \neq \boldsymbol{0}$ 时,$$
|
|
|
|
|
T(\boldsymbol{\alpha}+\boldsymbol{\beta})=\lambda(\boldsymbol{\alpha}+\boldsymbol{\beta})+\boldsymbol{\gamma} \neq T(\boldsymbol{\alpha})+T(\boldsymbol{\beta})=\lambda(\boldsymbol{\alpha}+\boldsymbol{\beta})+2\boldsymbol{\gamma}.$$
|
|
|
|
|
>结论得证。
|
|
|
|
|
|
|
|
|
|
>[!example] 例题5
|
|
|
|
|
证明 $P_n[x]=\{a_0+a_1x+\dots+a_nx^n \mid a_i \in \mathbb{R},i=0,1,\dots,n\}$ 上的求导变换 $T=\dfrac{\mathrm{d}}{\mathrm{d}x}$ 是线性变换。
|
|
|
|
|
|
|
|
|
|
>[!note] **解析**:
|
|
|
|
|
任取 $f(x)=a_0+a_1x+\dots+a_nx^n$,$g(x)=b_0+b_1x+\dots+b_nx^n \in P_n[x]$ 和 $k,l \in \mathbb{R}$,则$$\begin{aligned}\frac{\mathrm{d}}{\mathrm{d}x}[kf(x)+lg(x)]&=\frac{\mathrm{d}}{\mathrm{d}x}\left[k a_0+l b_0+(k a_1+l b_1)x+\dots+(k a_n+l b_n)x^n\right] \\
|
|
|
|
|
&=(k a_1+l b_1)+2(k a_2+l b_2)x+\dots+n(k a_n+l b_n)x^{n-1} \\
|
|
|
|
|
&=k a_1+2k a_2x+\dots+n k a_nx^{n-1}+l b_1+2l b_2x+\dots+n l b_nx^{n-1} \\
|
|
|
|
|
&=k\left(a_1+2a_2x+\dots+n a_nx^{n-1}\right)+l\left(b_1+2b_2x+\dots+n b_nx^{n-1}\right) \\
|
|
|
|
|
&=k\frac{\mathrm{d}}{\mathrm{d}x}[f(x)]+l\frac{\mathrm{d}}{\mathrm{d}x}[g(x)].
|
|
|
|
|
\end{aligned}$$
|
|
|
|
|
因此 $T=\dfrac{\mathrm{d}}{\mathrm{d}x}$ 在 $P_n[x]$ 上是线性变换。
|
|
|
|
|
|
|
|
|
|
### 线性变换的矩阵表示
|
|
|
|
|
|
|
|
|
|
线性空间一般包含无穷多个向量,因此分析每一个向量在线性变换下的像并不可行。而线性空间中的每个向量都可以写成一组基的线性组合,因此可转而研究线性变换在一组基下的表示。
|
|
|
|
|
|
|
|
|
|
设 $V$ 是线性空间,$\dim V=n$,$\boldsymbol{\alpha}_1,\boldsymbol{\alpha}_2,\dots,\boldsymbol{\alpha}_n$ 是 $V$ 的一组基,$T$ 是 $V$ 上的线性变换,显然 $T(\boldsymbol{\alpha}_j)\;(j=1,2,\dots,n)$ 可由基 $\boldsymbol{\alpha}_1,\boldsymbol{\alpha}_2,\dots,\boldsymbol{\alpha}_n$ 线性表示,即有
|
|
|
|
|
$$
|
|
|
|
|
T(\boldsymbol{\alpha}_j)=k_{1j}\boldsymbol{\alpha}_1+k_{2j}\boldsymbol{\alpha}_2+\dots+k_{nj}\boldsymbol{\alpha}_n\;(j=1,2,\dots,n).
|
|
|
|
|
$$
|
|
|
|
|
故
|
|
|
|
|
$$
|
|
|
|
|
\left[T(\boldsymbol{\alpha}_1)\;T(\boldsymbol{\alpha}_2)\;\dots\;T(\boldsymbol{\alpha}_n)\right]=\left[\boldsymbol{\alpha}_1\;\boldsymbol{\alpha}_2\;\dots\;\boldsymbol{\alpha}_n\right]
|
|
|
|
|
\begin{bmatrix}
|
|
|
|
|
k_{11}&k_{12}&\dots&k_{1n}\\
|
|
|
|
|
k_{21}&k_{22}&\dots&k_{2n}\\
|
|
|
|
|
\vdots&\vdots&&\vdots\\
|
|
|
|
|
k_{n1}&k_{n2}&\dots&k_{nn}
|
|
|
|
|
\end{bmatrix}.
|
|
|
|
|
$$
|
|
|
|
|
即
|
|
|
|
|
$$
|
|
|
|
|
\left[T(\boldsymbol{\alpha}_1)\;T(\boldsymbol{\alpha}_2)\;\dots\;T(\boldsymbol{\alpha}_n)\right]=\left[\boldsymbol{\alpha}_1\;\boldsymbol{\alpha}_2\;\dots\;\boldsymbol{\alpha}_n\right]A.
|
|
|
|
|
$$
|
|
|
|
|
|
|
|
|
|
>[!info] **定义**
|
|
|
|
|
设 $T$ 是线性空间 $V$ 上的线性变换,$\boldsymbol{\alpha}_1,\boldsymbol{\alpha}_2,\dots,\boldsymbol{\alpha}_n$ 是 $V$ 的一组基,若有 $n$ 阶方阵 $A$,使得 $$
|
|
|
|
|
\left[T(\boldsymbol{\alpha}_1)\;T(\boldsymbol{\alpha}_2)\;\dots\;T(\boldsymbol{\alpha}_n)\right]=\left[\boldsymbol{\alpha}_1\;\boldsymbol{\alpha}_2\;\dots\;\boldsymbol{\alpha}_n\right]A,$$
|
|
|
|
|
则称上式为线性变换 $T$ 在基 $\boldsymbol{\alpha}_1,\boldsymbol{\alpha}_2,\dots,\boldsymbol{\alpha}_n$ 下的**矩阵表示**,$A$ 称为线性变换 $T$ 在基 $\boldsymbol{\alpha}_1,\boldsymbol{\alpha}_2,\dots,\boldsymbol{\alpha}_n$ 下的**矩阵**。
|
|
|
|
|
>$A$ 的第 $j$ 列就是 $T(\boldsymbol{\alpha}_j)$ 在基 $\boldsymbol{\alpha}_1,\boldsymbol{\alpha}_2,\dots,\boldsymbol{\alpha}_n$ 下的坐标。
|
|
|
|
|
|
|
|
|
|
>[!info] **定理**
|
|
|
|
|
设 $n$ 维线性空间 $V$ 的基 $\boldsymbol{\alpha}_1,\boldsymbol{\alpha}_2,\dots,\boldsymbol{\alpha}_n$ 到 $\boldsymbol{\beta}_1,\boldsymbol{\beta}_2,\dots,\boldsymbol{\beta}_n$ 的过渡矩阵为 $C$,$V$ 中的线性变换 $T$ 在两组基下的矩阵分别为 $A$ 和 $B$,则 $B=C^{-1}AC$。
|
|
|
|
|
|
|
|
|
|
>[!note] **证明**
|
|
|
|
|
由 $\left[\boldsymbol{\beta}_1\;\boldsymbol{\beta}_2\;\dots\;\boldsymbol{\beta}_n\right]=\left[\boldsymbol{\alpha}_1\;\boldsymbol{\alpha}_2\;\dots\;\boldsymbol{\alpha}_n\right]C$,且 $$
|
|
|
|
|
\left[T(\boldsymbol{\alpha}_1)\;T(\boldsymbol{\alpha}_2)\;\dots\;T(\boldsymbol{\alpha}_n)\right]=\left[\boldsymbol{\alpha}_1\;\boldsymbol{\alpha}_2\;\dots\;\boldsymbol{\alpha}_n\right]A,$$ $$
|
|
|
|
|
\left[T(\boldsymbol{\beta}_1)\;T(\boldsymbol{\beta}_2)\;\dots\;T(\boldsymbol{\beta}_n)\right]=\left[\boldsymbol{\beta}_1\;\boldsymbol{\beta}_2\;\dots\;\boldsymbol{\beta}_n\right]B.$$
|
|
|
|
|
计算得:$$
|
|
|
|
|
\begin{aligned}
|
|
|
|
|
\left[T(\boldsymbol{\beta}_1)\;T(\boldsymbol{\beta}_2)\;\dots\;T(\boldsymbol{\beta}_n)\right]&=\left[T(\boldsymbol{\alpha}_1)\;T(\boldsymbol{\alpha}_2)\;\dots\;T(\boldsymbol{\alpha}_n)\right]C \\
|
|
|
|
|
&=\left[\boldsymbol{\alpha}_1\;\boldsymbol{\alpha}_2\;\dots\;\boldsymbol{\alpha}_n\right]AC \\
|
|
|
|
|
&=\left[\boldsymbol{\beta}_1\;\boldsymbol{\beta}_2\;\dots\;\boldsymbol{\beta}_n\right]C^{-1}AC.
|
|
|
|
|
\end{aligned} $$
|
|
|
|
|
所以 $B=C^{-1}AC$。(也就是说 $A$ 和 $B$ 是相似的)
|
|
|
|
|
|
|
|
|
|
>[!example] 例题6
|
|
|
|
|
线性空间 $P_{n-1}[x]$ 有基 $1,x,x^2,\dots,x^{n-1}$。定义 $P_{n-1}[x]$ 上的线性变换 $T$ 如下:对任意的 $f \in P_{n-1}[x]$, $T(f)=\frac{\mathrm{d}}{\mathrm{d}x}f-f.$
|
|
|
|
|
求 $T$ 在基 $1,x,x^2,\dots,x^{n-1}$ 下的矩阵表示。
|
|
|
|
|
|
|
|
|
|
>[!note] **解析**:
|
|
|
|
|
按照定义有 $$
|
|
|
|
|
\begin{aligned}
|
|
|
|
|
&\left[T(1)\;T(x)\;T(x^2)\;\dots\;T(x^{n-1})\right] \\
|
|
|
|
|
&=\left[-1\;1-x\;2x-x^2\;\dots\;(n-1)x^{n-2}-x^{n-1}\right] \\
|
|
|
|
|
&=\left[1\;x\;x^2\;\dots\;x^{n-2}\;x^{n-1}\right]
|
|
|
|
|
\begin{bmatrix}
|
|
|
|
|
-1&1&&&\\
|
|
|
|
|
&-1&2&&\\
|
|
|
|
|
&&-1&\ddots&\\
|
|
|
|
|
&&&\ddots&n-1\\
|
|
|
|
|
&&&&-1
|
|
|
|
|
\end{bmatrix},
|
|
|
|
|
\end{aligned}$$
|
|
|
|
|
所以 $T$ 在基 $1,x,x^2,\dots,x^{n-1}$ 下的矩阵为 $$
|
|
|
|
|
A=
|
|
|
|
|
\begin{bmatrix}
|
|
|
|
|
-1&1&&&\\
|
|
|
|
|
&-1&2&&\\
|
|
|
|
|
&&-1&\ddots&\\
|
|
|
|
|
&&&\ddots&n-1\\
|
|
|
|
|
&&&&-1
|
|
|
|
|
\end{bmatrix}.$$
|
|
|
|
|
|
|
|
|
|
>[!example] 例题7
|
|
|
|
|
定义 $\mathbb{R}^3$ 上的线性变换 $T$ 如下: $$
|
|
|
|
|
T\begin{bmatrix}x\\y\\z\end{bmatrix}=
|
|
|
|
|
\begin{bmatrix}x+y\\y-z\\z-x\end{bmatrix}.$$
|
|
|
|
|
设 $\mathbb{R}^3$ 的两组基 $$
|
|
|
|
|
\boldsymbol{e}_1=(1,0,0)^T,\;\boldsymbol{e}_2=(0,1,0)^T,\;\boldsymbol{e}_3=(0,0,1)^T;$$$$
|
|
|
|
|
\boldsymbol{v}_1=(1,-1,1)^T,\;\boldsymbol{v}_2=(2,1,1)^T,\;\boldsymbol{v}_3=(-1,3,1)^T.$$
|
|
|
|
|
分别求 $T$ 在基 $\boldsymbol{e}_1,\boldsymbol{e}_2,\boldsymbol{e}_3$ 和基 $\boldsymbol{v}_1,\boldsymbol{v}_2,\boldsymbol{v}_3$ 下的矩阵表示。
|
|
|
|
|
|
|
|
|
|
>[!note] **解析**:
|
|
|
|
|
设 $T$ 在基 $\boldsymbol{e}_1,\boldsymbol{e}_2,\boldsymbol{e}_3$ 下的矩阵为 $A$,则 $$
|
|
|
|
|
\left[T(\boldsymbol{e}_1)\;T(\boldsymbol{e}_2)\;T(\boldsymbol{e}_3)\right]=\left[\boldsymbol{e}_1\;\boldsymbol{e}_2\;\boldsymbol{e}_3\right]A,$$
|
|
|
|
|
即 $$A=
|
|
|
|
|
\begin{bmatrix}
|
|
|
|
|
1&1&0\\
|
|
|
|
|
0&1&-1\\
|
|
|
|
|
-1&0&1
|
|
|
|
|
\end{bmatrix}.$$
|
|
|
|
|
设 $T$ 在基 $\boldsymbol{v}_1,\boldsymbol{v}_2,\boldsymbol{v}_3$ 下的矩阵为 $B$,则 $$
|
|
|
|
|
\left[T(\boldsymbol{v}_1)\;T(\boldsymbol{v}_2)\;T(\boldsymbol{v}_3)\right]=\left[\boldsymbol{v}_1\;\boldsymbol{v}_2\;\boldsymbol{v}_3\right]B,$$
|
|
|
|
|
即 $$\begin{bmatrix}0&3&2\\-2&0&2\\0&-1&2\end{bmatrix}=
|
|
|
|
|
\begin{bmatrix}
|
|
|
|
|
1&2&-1\\
|
|
|
|
|
-1&1&3\\
|
|
|
|
|
1&1&1
|
|
|
|
|
\end{bmatrix}B,$$
|
|
|
|
|
所以 $$
|
|
|
|
|
\begin{aligned}
|
|
|
|
|
B&=
|
|
|
|
|
\begin{bmatrix}
|
|
|
|
|
1&2&-1\\
|
|
|
|
|
-1&1&3\\
|
|
|
|
|
1&1&1
|
|
|
|
|
\end{bmatrix}^{-1}
|
|
|
|
|
\begin{bmatrix}
|
|
|
|
|
0&3&2\\
|
|
|
|
|
-2&0&2\\
|
|
|
|
|
0&-1&2
|
|
|
|
|
\end{bmatrix} \\
|
|
|
|
|
&=\frac{1}{8}
|
|
|
|
|
\begin{bmatrix}
|
|
|
|
|
-2&-3&7\\
|
|
|
|
|
4&2&-2\\
|
|
|
|
|
-2&1&3
|
|
|
|
|
\end{bmatrix}
|
|
|
|
|
\begin{bmatrix}
|
|
|
|
|
0&3&2\\
|
|
|
|
|
-2&0&2\\
|
|
|
|
|
0&-1&2\end{bmatrix}=\frac{1}{8}\begin{bmatrix}
|
|
|
|
|
6&-13&4\\
|
|
|
|
|
-4&14&8\\
|
|
|
|
|
-2&-9&4
|
|
|
|
|
\end{bmatrix}.\end{aligned}$$
|
|
|
|
|
|
|
|
|
|
>[!summary] 习题
|
|
|
|
|
>1. 集合 $V=\{\omega=(a_2x^2+a_1x+a_0)e^x \mid a_2,a_1,a_0 \in \mathbb{R}\}$ 对于函数的线性运算构成 3 维线性空间,定义变换 $T(f(x))=\dfrac{\mathrm{d}}{\mathrm{d}x}f(x)$,求 $T$ 在基 $x^2e^x, xe^x, e^x$ 下的矩阵。
|
|
|
|
|
>2. 二阶实对称矩阵的全体 $$
|
|
|
|
|
V=\left\{A=\begin{bmatrix}x_1&x_2\\x_2&x_3\end{bmatrix}\;\bigg|\;x_1,x_2,x_3 \in \mathbb{R}\right\}$$
|
|
|
|
|
对于矩阵的线性运算构成 3 维线性空间。在 $V$ 中取一组基 $$
|
|
|
|
|
A_1=\begin{bmatrix}1&0\\0&0\end{bmatrix},\;
|
|
|
|
|
A_2=\begin{bmatrix}0&1\\1&0\end{bmatrix},\;
|
|
|
|
|
A_3=\begin{bmatrix}0&0\\0&1\end{bmatrix}.$$
|
|
|
|
|
在 $V$ 中定义变换 $$
|
|
|
|
|
T(A)=\begin{bmatrix}1&0\\1&1\end{bmatrix}A\begin{bmatrix}1&1\\0&1\end{bmatrix},$$
|
|
|
|
|
求 $T$ 在基 $A_1,A_2,A_3$ 下的矩阵。
|
|
|
|
|
>3. 已知 $\mathbb{R}^3$ 中线性变换 $T$ 在基 $\boldsymbol{\alpha}_1,\boldsymbol{\alpha}_2,\boldsymbol{\alpha}_3$ 下的矩阵为 $$
|
|
|
|
|
A = \begin{bmatrix} 1&2&-1\\ -1&1&3\\ 1&1&1 \end{bmatrix},$$
|
|
|
|
|
求 $T$ 在基 $\boldsymbol{\alpha}_3,\boldsymbol{\alpha}_2,\boldsymbol{\alpha}_1$ 下的矩阵。
|
|
|
|
|
>4. 已知 $\boldsymbol{\alpha}_1=(1,1,1)^T,\;\boldsymbol{\alpha}_2=(1,1,0)^T,\;\boldsymbol{\alpha}_3=(1,0,0)^T$ 为 $\mathbb{R}^3$ 的一组基,$T$ 为 $\mathbb{R}^3$ 上的线性变换,且 $$
|
|
|
|
|
T(\boldsymbol{\alpha}_1)=(1,2,3)^T,\; T(\boldsymbol{\alpha}_2)=(0,1,2)^T,\; T(\boldsymbol{\alpha}_3)=(0,0,1)^T,$$
|
|
|
|
|
求 $T$ 在基 $\boldsymbol{\alpha}_1 , \boldsymbol{\alpha}_2 , \boldsymbol{\alpha}_3$ 下的矩阵。
|
|
|
|
|
|
|
|
|
|
>[!note] 习题解答
|
|
|
|
|
>1. 取基向量 $e_1 = x^2 e^x$, $e_2 = x e^x$, $e_3 = e^x$。计算导函数:
|
|
|
|
|
> - $T(e_1) = \frac{d}{dx}(x^2 e^x) = (x^2 + 2x)e^x = 1 \cdot e_1 + 2 \cdot e_2 + 0 \cdot e_3$,
|
|
|
|
|
> - $T(e_2) = \frac{d}{dx}(x e^x) = (x+1)e^x = 0 \cdot e_1 + 1 \cdot e_2 + 1 \cdot e_3$,
|
|
|
|
|
> - $T(e_3) = \frac{d}{dx}(e^x) = e^x = 0 \cdot e_1 + 0 \cdot e_2 + 1 \cdot e_3$。
|
|
|
|
|
> 故 $T$ 在基下的矩阵为 $\begin{bmatrix}1&0&0\\2&1&0\\0&1&1\end{bmatrix}.$
|
|
|
|
|
>2. 验证 $T$ 是 $V$ 到 $V$ 的线性变换:对任意 $A=\begin{bmatrix}x_1&x_2\\x_2&x_3\end{bmatrix}\in V$, $$
|
|
|
|
|
T(A)=\begin{bmatrix}1&0\\1&1\end{bmatrix}A\begin{bmatrix}1&1\\0&1\end{bmatrix}
|
|
|
|
|
= \begin{bmatrix}x_1 & x_1+x_2 \\ x_1+x_2 & x_1+2x_2+x_3\end{bmatrix} \in V.$$
|
|
|
|
|
>计算基的像:
|
|
|
|
|
> - $T(A_1)=\begin{bmatrix}1&1\\1&1\end{bmatrix}=1\cdot A_1+1\cdot A_2+1\cdot A_3$,
|
|
|
|
|
> - $T(A_2)=\begin{bmatrix}0&1\\1&2\end{bmatrix}=0\cdot A_1+1\cdot A_2+2\cdot A_3$,
|
|
|
|
|
> - $T(A_3)=\begin{bmatrix}0&0\\0&1\end{bmatrix}=0\cdot A_1+0\cdot A_2+1\cdot A_3$。
|
|
|
|
|
>故 $T$ 在基下的矩阵为 ${\begin{bmatrix}1&0&0\\1&1&0\\1&2&1\end{bmatrix}}.$
|
|
|
|
|
>3. 设旧基 $\mathcal{B}=(\boldsymbol{\alpha}_1,\boldsymbol{\alpha}_2,\boldsymbol{\alpha}_3)$,新基 $\mathcal{C}=(\boldsymbol{\alpha}_3,\boldsymbol{\alpha}_2,\boldsymbol{\alpha}_1)$。过渡矩阵 $$P = \begin{bmatrix}0&0&1\\0&1&0\\1&0&0\end{bmatrix},\quad P^{-1}=P.$$
|
|
|
|
|
$T$ 在基 $\mathcal{C}$ 下的矩阵 $B = P^{-1}AP = PAP$。计算:$$AP = \begin{bmatrix}1&2&-1\\-1&1&3\\1&1&1\end{bmatrix}
|
|
|
|
|
\begin{bmatrix}0&0&1\\0&1&0\\1&0&0\end{bmatrix}
|
|
|
|
|
= \begin{bmatrix}-1&2&1\\3&1&-1\\1&1&1\end{bmatrix},$$ $$B = P(AP) = \begin{bmatrix}0&0&1\\0&1&0\\1&0&0\end{bmatrix}
|
|
|
|
|
\begin{bmatrix}-1&2&1\\3&1&-1\\1&1&1\end{bmatrix}
|
|
|
|
|
= \begin{bmatrix}1&1&1\\3&1&-1\\-1&2&1\end{bmatrix}.$$
|
|
|
|
|
故所求矩阵为 ${\begin{bmatrix}1&1&1\\3&1&-1\\-1&2&1\end{bmatrix}}.$
|
|
|
|
|
>4. 记基矩阵 $P = [\boldsymbol{\alpha}_1,\boldsymbol{\alpha}_2,\boldsymbol{\alpha}_3] = \begin{bmatrix}1&1&1\\1&1&0\\1&0&0\end{bmatrix}$, 像矩阵 $B = [T(\boldsymbol{\alpha}_1),T(\boldsymbol{\alpha}_2),T(\boldsymbol{\alpha}_3)] = \begin{bmatrix}1&0&0\\2&1&0\\3&2&1\end{bmatrix}$。 设 $T$ 在基下的矩阵为 $A$,则 $B = PA$,故 $A = P^{-1}B$。计算 $$P^{-1} = \begin{bmatrix}0&0&1\\0&1&-1\\1&-1&0\end{bmatrix},$$$$
|
|
|
|
|
A = P^{-1}B = \begin{bmatrix}0&0&1\\0&1&-1\\1&-1&0\end{bmatrix}
|
|
|
|
|
\begin{bmatrix}1&0&0\\2&1&0\\3&2&1\end{bmatrix}
|
|
|
|
|
= \begin{bmatrix}3&2&1\\-1&-1&-1\\-1&-1&0\end{bmatrix}.$$
|
|
|
|
|
验证:$T(\boldsymbol{\alpha}_1) = P \cdot (3,-1,-1)^T = (1,2,3)^T$,正确。
|
|
|
|
|
故所求矩阵为 ${\begin{bmatrix}3&2&1\\-1&-1&-1\\-1&-1&0\end{bmatrix}}.$
|
|
|
|
|
|
|
|
|
|
# Section 2 相似矩阵与对角化
|
|
|
|
|
#### 特征值
|
|
|
|
|
>[!info] 基本定义
|
|
|
|
|
>1. 设 $n$ 阶方阵 $A = [a_{ij}] \in \mathbb{C}^{n \times n}$,若存在数 $\lambda$ 和非零向量 $\xi$ 使得$A\xi = \lambda \xi$,
|
|
|
|
|
>则称 $\lambda$ 是矩阵 $A$ 的一个**特征值**,$\xi$ 是矩阵 $A$ 对应于 $\lambda$ 的一个**特征向量**。
|
|
|
|
|
>2. 设 $A$ 为 $n$ 阶方阵,$\lambda$ 是一个变量,则矩阵 $\lambda E - A$ 称为 $A$ 的**特征矩阵**,其行列式 $f_A(\lambda) = |\lambda E - A|$ 称为 $A$ 的**特征多项式**,方程 $|\lambda E - A| = 0$ 称为 $A$ 的**特征方程**。
|
|
|
|
|
|
|
|
|
|
>[!info] 求特征值的基本方式:
|
|
|
|
|
>1. 构造特征多项式:$f(\lambda) = |\lambda E - A|$($E$ 为 $n$ 阶单位矩阵),本质是将 $A\xi = \lambda\xi$ 变形为 $(\lambda E - A)\xi = 0$,由于 $\xi \neq 0$,齐次线性方程组有非零解的充要条件是系数行列式为 0,即 $|\lambda E - A| = 0$.
|
|
|
|
|
>2. 求解特征方程:$|\lambda E - A| = 0$,得到的根即为 $A$ 的特征值,此时根的重数为**代数重数**.
|
|
|
|
|
>3. 求对应特征向量:对每个特征值 $\lambda_i$,解齐次方程组 $(\lambda_i E - A)x = 0$,其非零解即为对应 $\lambda_i$ 的特征向量,所有非零解构成该特征值的特征子空间;该子空间的维数为**几何重数**.
|
|
|
|
|
|
|
|
|
|
特征值,顾名思义,就是体现了这个矩阵的“特征”. 这一点在矩阵的相似表现的尤为明显.
|
|
|
|
|
>[!info] 特征值最基本的性质:
|
|
|
|
|
>1. 特征值之和等于矩阵的迹(主对角线元素之和),即 $\sum\limits_{i=1}^{n}\lambda_i=\sum\limits_{i=1}^{n}a_{ii}$;
|
|
|
|
|
>2. 特征值之积等于矩阵的行列式,即$\prod\limits_{i=1}^{n}\lambda_i=|A|$.
|
|
|
|
|
>3. 对于有理函数 $f(x)$ ,矩阵 $f(A)$ 的特征值为 $f(\lambda)$ ,对应的特征向量不变. 相应的,如果 $A\sim B$,则 $f(A) \sim f(B)$.
|
|
|
|
|
>4. 相似矩阵特征值相等.
|
|
|
|
|
#### 相似矩阵的定义与性质
|
|
|
|
|
数域 $K$ 上两个 $n$ 阶矩阵$A,B$ 相似的定义为: 存在数域$K$ 上的可逆矩阵$P$ 使得$B = P^{-1}AP$. 记为
|
|
|
|
|
$A \sim B$.
|
|
|
|
|
>[!info] 相似矩阵的性质:
|
|
|
|
|
>1. 相似是一种等价关系, 即满足反身性, 对称性, 传递性.
|
|
|
|
|
>2. $A,B$ 相似, 可以得到 $A,B$ 秩相同, 但是不要求$A,B$ 都可逆, 更不要求$A,B$ 对称.
|
|
|
|
|
>3. 对于任意的有理式 $f(x)$, 都有$f(A) \sim f(B)$. 并且, 如果 $B = P^{-1}AP$, 则$f(B) = P^{-1}f(A)P$. 对于 $A^*$,可视作 $|A|A^{-1}$,是有理式中的一个 $-1$ 次方项目.
|
|
|
|
|
>4. $A_1 \sim B_1,\;A_2 \sim B_2$, 不一定有$A_1+A_2 \sim B_1+B_2$. 只有当$P^{-1}A_1P = B_1$ 且$P^{-1}A_2P = B_2$ 时(相同的过渡矩阵$P$), 才有 $P^{-1}(A_1+A_2)P = B_1+B_2$, 即$A_1+A_2 \sim B_1+B_2$, 这是很苛刻的条件. 你将会在**例题4**中看到.
|
|
|
|
|
>5. 如果$A_1 \sim A_2$, 且$B_1 \sim B_2$, 则显然有$\begin{pmatrix}A_1 & O \\O & B_1\end{pmatrix}\sim\begin{pmatrix}A_2 & O \\O & B_2\end{pmatrix}.$
|
|
|
|
|
> 原因是若$P^{-1}A_1P = A_2,\;Q^{-1}B_1Q = B_2$, 则$\begin{pmatrix}P & O \\O & Q\end{pmatrix}^{-1}\begin{pmatrix}A_1 & O \\O & B_1\end{pmatrix}\begin{pmatrix}P & O \\O & Q\end{pmatrix}=\begin{pmatrix}A_2 & O \\O & B_2\end{pmatrix}.$
|
|
|
|
|
|
|
|
|
|
>[!todo] 判断相似关系的步骤(一般是选择题)
|
|
|
|
|
>1. 判断特征值是否相等(先看迹,行列式,排除不了就算特征值)
|
|
|
|
|
>2. 根据 $\mathrm{rank}(A-kE)=\mathrm{rank}(B-kE)$ ,带几个好算的 $k$ 进去,看看秩是否相等,因为 $A-kE\sim B-kE$,有 $P^{-1}(A-kE)P= B-kE$,注意到 $P$ 可逆,故$\mathrm{rank}(A-kE)=\mathrm{rank}(B-kE)$.
|
|
|
|
|
>3. 如果特征值和行列式均相等,接着算重数,判断是否可对角化,根据相似的传递性得出结论. 注意:当代数重数,几何重数,特征值均相同时,两个矩阵不一定相似,例如:$\begin{pmatrix} 2 & 1 & 0 & 0 \\ 0 & 2 & 0 & 0 \\ 0 & 0 & 2 & 1 \\ 0 & 0 & 0 & 2 \end{pmatrix}$与$\begin{pmatrix} 2 & 1 & 0 & 0 \\ 0 & 2 & 1 & 0 \\ 0 & 0 & 2 & 0 \\ 0 & 0 & 0 & 2 \end{pmatrix}$几何重数,代数重数,特征值均相等,然而却不相似.
|
|
|
|
|
#### 对角化
|
|
|
|
|
将一个方阵通过可逆变换变为对角矩阵($A=P^{-1}\Lambda P$)的过程就是相似对角化,相似对角化最根本的应用就是求方阵的有理式( $\ f(A)=P^{-1}f(\Lambda)P$ ),这在科学计算中起到了很大的简化作用.
|
|
|
|
|
$A$ 能对角化的充要条件是 $A$ 有 $n$ 个**线性无关的特征向量**,这要求 $A$ 的所有特征值的几何重数和代数重数相等,且 $A$ 的所有特征值的重数和为 $n$ .
|
|
|
|
|
对角化的步骤:
|
|
|
|
|
1. 确定特征值 $\lambda_i$,并对每个特征值确定特征向量 $\boldsymbol\xi_i$ (在此时判断能否对角化);
|
|
|
|
|
2. 按照顺序,依次将特征向量与特征值写入变换矩阵和对角矩阵:
|
|
|
|
|
$$P=\begin{bmatrix}\boldsymbol\xi_1&\boldsymbol\xi_2&\cdots&\boldsymbol\xi_n\end{bmatrix},
|
|
|
|
|
\Lambda=\begin{bmatrix}\lambda_1&&&\\&\lambda_2&&\\&&\ddots&\\&&&\lambda_n\end{bmatrix},A=P^{-1}\Lambda P$$
|
|
|
|
|
|
|
|
|
|
实对称矩阵是一类特殊的矩阵:实对称矩阵就是天选之子,本身就能相似对角化,因为他有 $n$ 个实特征向量,并且,实对称矩阵还可以正交相似对角化,即相似变化矩阵可以是正交矩阵(这个性质非常重要!)
|
|
|
|
|
实对称矩阵正交相似对角化的步骤:
|
|
|
|
|
1. 确定特征值 $\lambda_i$,并对每个特征值确定特征向量 $\boldsymbol\xi_i$ (在此时判断能否对角化);
|
|
|
|
|
2. <span style="color:ffaa33;font-weight: bold;">对特征向量作施密特正交化;(不同特征值的特征向量天然正交)</span>
|
|
|
|
|
3. 按照顺序,依次将特征向量与特征值写入变换矩阵和对角矩阵.
|
|
|
|
|
|
|
|
|
|
若 $A$ 与某个对角矩阵 $B$ 相似,我们可以根据 $B$ 的性质来反推 $A$ 的性质(秩,行列式,特征值),一般地,求抽象矩阵的行列式,需要想到根据特征值的乘积得出.
|
|
|
|
|
## 常见题型
|
|
|
|
|
特征值常见的小题就是针对其性质进行设问.
|
|
|
|
|
>[!example] 例题8
|
|
|
|
|
>设$\boldsymbol{A}=\begin{bmatrix}-1 & 2 & 2 \\ 2&-1&-2\\2&-2&-1\end{bmatrix}$,$\boldsymbol E$是3阶单位矩阵,则矩阵$\boldsymbol{E}+2\boldsymbol{A}-\boldsymbol{A}^2$全部特征值之和是____
|
|
|
|
|
|
|
|
|
|
>[!note] 解析
|
|
|
|
|
>易知$\boldsymbol A$的特征值为$\lambda =1,1,-5$,令$\boldsymbol B=\boldsymbol{E}+2\boldsymbol{A}-\boldsymbol{A}^2,$
|
|
|
|
|
>$\boldsymbol\xi$ 为矩阵$A$的一个特征向量,$\boldsymbol B\boldsymbol\xi=(1+2\lambda-\lambda^2)\boldsymbol\xi$,
|
|
|
|
|
>则有$\boldsymbol B$ 的特征值 $\lambda'=(1+2\lambda-\lambda^2)=2,2,-34$,则答案为$2+2-34=-30$
|
|
|
|
|
##### 1. 针对“迹”设问
|
|
|
|
|
>[!hint] 提示
|
|
|
|
|
>秩为$1$的矩阵$A\in\mathbb{R}^{n\times n}$的特征值有如下特征:
|
|
|
|
|
>(1)$0$为其特征值,且几何重数均为$n-1$,若$A$能相似对角化,则$0$的代数重数也为$n-1$;
|
|
|
|
|
>>证明:因为$r(A)=1<n$,所以$|A|=0$,故$0$是$A$的一个特征值。考虑齐次线性方程组$A\boldsymbol{x}=\boldsymbol{0}$.由于$r(A)=1$,$\mathrm{dim}N(A)=n-1$,所以特征值$0$的几何重数为$n-1$。若矩阵$A$能相似对角化,则代数重数与几何重数相等,也为$n-1$。若$A$不能相似对角化,则$0$的代数重数为$n$。
|
|
|
|
|
>
|
|
|
|
|
>(2)它的另一个特征值为 $\mathrm{tr}(A)$.
|
|
|
|
|
>>这个特征可以由“特征值之和等于矩阵的迹”得出.
|
|
|
|
|
>
|
|
|
|
|
>秩为 $1$ 的矩阵 $A$ 可以拆成 $A=\boldsymbol\alpha\boldsymbol\beta^\mathrm{T}$,$\boldsymbol\alpha=(a_1,a_2,\cdots,a_n),\boldsymbol\beta=(b_1,b_2,\cdots,b_n)$
|
|
|
|
|
>此时 $A$ 的迹为 $\displaystyle\prod\limits_{i=1}^na_ib_i=\boldsymbol\beta\boldsymbol\alpha^\mathrm{T}$
|
|
|
|
|
|
|
|
|
|
>[!example] ([[线代2019秋A|2019]])例题9
|
|
|
|
|
设 $E$ 为 $3$ 阶单位矩阵,$\alpha$ 为一个 $3$ 维单位列向量,则矩阵 $E-\alpha\alpha^\text{T}$ 的全部 $3$ 个特征值为\_\_\_\_\_\_
|
|
|
|
|
|
|
|
|
|
>[!note] 解析
|
|
|
|
|
>设 $B=\alpha\alpha^T$,该矩阵为**秩 $1$ 矩阵**(因 $\alpha$ 是单位列向量,$\alpha^T\alpha=1$).
|
|
|
|
|
>秩 $1$ 矩阵的特征值性质:非零特征值为矩阵的迹 $\text{tr}(B)=\alpha^T\alpha=1$,其余 $n-1=2$ 个特征值为 $0$(秩 $1$ 矩阵的非零特征值个数等于秩).
|
|
|
|
|
>若 $B\boldsymbol{x}=\lambda\boldsymbol{x}$($\boldsymbol{x}$为特征向量),则 $(E-B)\boldsymbol{x}=(1-\lambda)\boldsymbol{x}$,即$E-B$ 的特征值为 $1-\lambda$.
|
|
|
|
|
>代入 $B$ 的特征值 $\lambda=1,0,0$,得 $E-B$ 的特征值为 $1-1=0$,$1-0=1$,$1-0=1$,即 $1,1,0$. (最后这里也包含了接下来会用到的针对“有理函数”设问)
|
|
|
|
|
|
|
|
|
|
>[!example] 例题10
|
|
|
|
|
>已知 $n(n\geq2)$维列向量 $\alpha,\beta$ 满足 $\beta^T\alpha=-3$,则方阵 $(\beta\alpha^T)^2$ 的非零特征值为$\underline{\qquad}$.
|
|
|
|
|
|
|
|
|
|
>[!note] 解析
|
|
|
|
|
>设 $A=\beta\alpha^T$(秩 1 矩阵),计算 $A^2$:
|
|
|
|
|
>$A^2=(\beta\alpha^T)(\beta\alpha^T)=\beta(\alpha^T\beta)\alpha^T=(\alpha^T\beta)A$
|
|
|
|
|
>注意:$\alpha^T\beta=(\beta^T\alpha)^T$(矩阵转置性质),而 $\beta^T\alpha=-3$(数,转置等于自身),故 $\alpha^T\beta=-3$,因此 $A^2=-3A$。
|
|
|
|
|
>由上面的性质,我们知道$A$的特征值只有可能是$0$或$-3$,又$A$不可能只有$0$一种特征值,故$A$的非零特征值只能为$-3$,从而$A^2$的非零特征值为$9$.
|
|
|
|
|
|
|
|
|
|
>[!example] 例题11
|
|
|
|
|
>设 $\boldsymbol{\beta}_1, \boldsymbol{\beta}_2, \dots, \boldsymbol{\beta}_m$ 均为实数域上的 n 维列向量,其中 m < n ,证明 $\boldsymbol{\beta}_1, \boldsymbol{\beta}_2, \dots, \boldsymbol{\beta}_m$ 线性无关的充要条件$$\begin{vmatrix}
|
|
|
|
|
\boldsymbol{\beta}_1^\mathrm{T}\boldsymbol{\beta}_1 & \boldsymbol{\beta}_1^\mathrm{T}\boldsymbol{\beta}_2 & \dots & \boldsymbol{\beta}_1^\mathrm{T}\boldsymbol{\beta}_m \\
|
|
|
|
|
\boldsymbol{\beta}_2^\mathrm{T}\boldsymbol{\beta}_1 & \boldsymbol{\beta}_2^\mathrm{T}\boldsymbol{\beta}_2 & \dots & \boldsymbol{\beta}_2^\mathrm{T}\boldsymbol{\beta}_m \\
|
|
|
|
|
\vdots & \vdots & & \vdots \\
|
|
|
|
|
\boldsymbol{\beta}_m^\mathrm{T}\boldsymbol{\beta}_1 & \boldsymbol{\beta}_m^\mathrm{T}\boldsymbol{\beta}_2 & \dots & \boldsymbol{\beta}_m^\mathrm{T}\boldsymbol{\beta}_m
|
|
|
|
|
\end{vmatrix}
|
|
|
|
|
\neq 0.$$
|
|
|
|
|
|
|
|
|
|
>[!note] **证明:**
|
|
|
|
|
设矩阵$B=\begin{bmatrix}\boldsymbol{\beta}_1\ \boldsymbol{\beta}_2\cdots\ \boldsymbol{\beta}_m\end{bmatrix}$,则$$B^TB=\begin{bmatrix}\boldsymbol{\beta}_1^\mathrm{T}\boldsymbol{\beta}_1 & \boldsymbol{\beta}_1^\mathrm{T}\boldsymbol{\beta}_2 & \dots & \boldsymbol{\beta}_1^\mathrm{T}\boldsymbol{\beta}_m \\
|
|
|
|
|
\boldsymbol{\beta}_2^\mathrm{T}\boldsymbol{\beta}_1 & \boldsymbol{\beta}_2^\mathrm{T}\boldsymbol{\beta}_2 & \dots & \boldsymbol{\beta}_2^\mathrm{T}\boldsymbol{\beta}_m \\
|
|
|
|
|
\vdots & \vdots & & \vdots \\
|
|
|
|
|
\boldsymbol{\beta}_m^\mathrm{T}\boldsymbol{\beta}_1 & \boldsymbol{\beta}_m^\mathrm{T}\boldsymbol{\beta}_2 & \dots & \boldsymbol{\beta}_m^\mathrm{T}\boldsymbol{\beta}_m\end{bmatrix}.$$考虑线性方程组$B^TB\boldsymbol{x}=\boldsymbol{0}$和$B\boldsymbol{x}=\boldsymbol{0}$.下证这两个线性方程组同解.
|
|
|
|
|
(i)若$B\boldsymbol{y}=\boldsymbol{0}$,则$B^TB\boldsymbol{y}=B^T\boldsymbol{0}=\boldsymbol{0}$,故$N(B)\subseteq N(B^TB)$;
|
|
|
|
|
(ii)若$B^TB\boldsymbol{y}=\boldsymbol{0}$,两边左乘$\boldsymbol{y}^T$得$\boldsymbol y^TB^TB\boldsymbol y=(B\boldsymbol y)^TB\boldsymbol y=<B\boldsymbol y,B \boldsymbol y>=0$,故$B\boldsymbol y=\boldsymbol0$,从而$N(B^TB)\subseteq N(B)$.
|
|
|
|
|
综上,$N(B^TB)=N(B)$,即线性方程组$B^TB\boldsymbol{x}=\boldsymbol{0}$和$B\boldsymbol{x}=\boldsymbol{0}$同解.
|
|
|
|
|
而$|B^TB|\neq0\Leftrightarrow$方程$B^TB\boldsymbol x=\boldsymbol 0$有唯一零解$\Leftrightarrow B\boldsymbol x=\boldsymbol 0$有唯一零解$\Leftrightarrow \boldsymbol{\beta}_1, \boldsymbol{\beta}_2, \dots, \boldsymbol{\beta}_m$ 线性无关.证毕.
|
|
|
|
|
##### 2. 针对“有理函数”设问
|
|
|
|
|
>[!example] 例题12
|
|
|
|
|
>已知 $4$ 阶矩阵 $A$ 与 $B$ 相似,$A$ 的全部特征值为 $1,2,3,4$,则行列式 $|B^{-1}-E|$ 为$\underline{\qquad}$.
|
|
|
|
|
|
|
|
|
|
>[!note] 解析
|
|
|
|
|
>“对于有理函数 $f(x)$ ,矩阵 $f(A)$ 的特征值为 $f(\lambda)$ ,对应的特征向量不变. ”
|
|
|
|
|
>根据这一条性质,我们求得矩阵 $B^{-1}-E$ 的所有特征值,进而求得行列式.
|
|
|
|
|
>$f(x)=\frac{1}{x}-1$,则 $B^{-1}-E$ 的特征值为 $0,-\frac12, -\frac23,-\frac34$,相乘结果为 $0$,故答案为 $0$.
|
|
|
|
|
|
|
|
|
|
>[!example] 例题13
|
|
|
|
|
>设 $\boldsymbol{A}=\begin{bmatrix}-1 & 2 & 2 \\ 2&-1&-2\\2&-2&-1\end{bmatrix}$,$\boldsymbol E$ 是3阶单位矩阵,则矩阵 $\boldsymbol{E}+2\boldsymbol{A}-\boldsymbol{A}^2$ 全部特征值之和是____
|
|
|
|
|
|
|
|
|
|
>[!note] 解析
|
|
|
|
|
>易知 $\boldsymbol A$ 的特征值为 $\lambda =1,1,-5$ ,令 $f(x)=-x^2+2x+1$,
|
|
|
|
|
>$f(\boldsymbol A)$ 的特征值 $\lambda'=f(\lambda)=(1+2\lambda-\lambda^2)=2,2,-34$,则答案为 $2+2-34=-30$
|
|
|
|
|
|
|
|
|
|
>[!example] ([[线代2022秋A|2022]])例题14
|
|
|
|
|
已知 $n$ 阶方阵$\boldsymbol{A}$与$\boldsymbol{B}$相似,$\boldsymbol{C}$与$\boldsymbol{D}$相似,则下列命题中正确的是【】
|
|
|
|
|
A. $\boldsymbol{A}+\boldsymbol{C}$与$\boldsymbol{B}+\boldsymbol{D}$相似.
|
|
|
|
|
B. $\boldsymbol{AC}$与$\boldsymbol{BD}$相似.
|
|
|
|
|
C. $\boldsymbol{A}^2+\boldsymbol{E}$与$\boldsymbol{B}^2+\boldsymbol{E}$相似.
|
|
|
|
|
D. $\boldsymbol{A}^\text{T}+\boldsymbol{A}$与$\boldsymbol{B}^\text{T}+\boldsymbol{B}$相似.
|
|
|
|
|
|
|
|
|
|
>[!note] 解析
|
|
|
|
|
>C选项是一个典型的 $f(A)\sim f(B)\ ,f(x)=x^2+1$ 结构,如果熟悉性质可以秒选
|
|
|
|
|
|
|
|
|
|
>[!warning] 注意!
|
|
|
|
|
>转置不能作为有理式的一部分!
|
|
|
|
|
##### 3. 针对“本质”设问
|
|
|
|
|
相似大题在设问时,往往回归“特征值”“相似”的本源,用特征多项式求解特征值,并应用特征值的性质; 小题偶有考察相关基本性质的题.
|
|
|
|
|
>[!example] 例题15
|
|
|
|
|
>$n$ 阶方阵 $\boldsymbol A$ 有 $n$ 个不同的特征值是 $\boldsymbol A$ 与对角阵相似的 $\qquad\qquad\qquad$【$\qquad$】
|
|
|
|
|
>A.充分必要条件$\qquad\qquad\qquad\qquad\qquad$B.充分不必要条件
|
|
|
|
|
>C.必要不充分条件$\qquad\qquad\qquad\qquad\quad$D.既不充分也不必要条件
|
|
|
|
|
|
|
|
|
|
>[!note] 解析
|
|
|
|
|
>设 $A$ 是一个 $n\times n$ 的方阵:
|
|
|
|
|
>1. 若 $A$ 有 $n$ 个不同的特征值,则每个特征值至少有一个对应的特征向量;
|
|
|
|
|
>2. 不同特征值对应的特征向量一定是线性无关的;
|
|
|
|
|
>3. 所以当 $A$ 有 $n$ 个不同特征值时,$A$ 一定有 $n$ 个线性无关的特征向量;
|
|
|
|
|
>4. 根据矩阵可对角化的充要条件,$A$ 可以与对角阵相似;
|
|
|
|
|
>另一方面,
|
|
|
|
|
>5. 如果 $A$ 可以与对角阵相似,即 $A$ 有 $n$ 个线性无关的特征向量;
|
|
|
|
|
>6. 这些特征向量可能来自重复的特征值;
|
|
|
|
|
>举例来说,矩阵 $\boldsymbol{A}=\begin{bmatrix}-2 & 1 & 1 \\ 0&2&0\\4&1&3\end{bmatrix}$ 相似于对角阵 $\boldsymbol{D}=\begin{bmatrix}-1 & 0 & 0 \\ 0&2&0\\0&0&2\end{bmatrix}$
|
|
|
|
|
>它只有两个不同的特征值 $−1$ 和 $2$,但仍能对角化;
|
|
|
|
|
>
|
|
|
|
|
所以,“有 $n$ 个不同特征值”不是必要条件。
|
|
|
|
|
综上,$n$ 阶方阵 $A$ 有 $n$ 个不同特征值是其可对角化的**充分不必要条件**。
|
|
|
|
|
|
|
|
|
|
>[!example] ([[线代2023秋A|2023]])例题16
|
|
|
|
|
>设矩阵 $A=\begin{bmatrix}3&1&2\\0&a&0\\2&b&3\end{bmatrix}$ 仅有两个相异特征值,且 $A$ 相似于对角矩阵,求 $a,b$, 并求可逆矩阵 $P$,使得$P^{-1}AP$ 为对角矩阵.
|
|
|
|
|
|
|
|
|
|
>[!note] 解析
|
|
|
|
|
>通过定义,求特征值:$\lambda E-A=\begin{bmatrix}\lambda-3&-1&-2\\0&\lambda-a&0\\-2&-b&\lambda-3\end{bmatrix}$,
|
|
|
|
|
> $|\lambda E-A|=0 \Rightarrow (\lambda-a)(\lambda-5)(\lambda-1)=0$
|
|
|
|
|
> $A$ 仅有两个相异特征值,说明 $a=5$ 或 $a=1$.
|
|
|
|
|
> 如果 $a=5$:特征值 $5$ 的代数重数为 $2$;因为 $A$ 能相似对角化,所以相应的几何重数也为 $2$.
|
|
|
|
|
> $(5E-A)\boldsymbol x=\boldsymbol 0$,即$\begin{bmatrix}2&-1&-2\\0&0&0\\-2&-b&2\end{bmatrix}\boldsymbol x=\boldsymbol 0$,由 $\text{rank}(5E-A)=1$ 得 $b=-1$;对应的特征向量为$(1,2,0)^\mathrm{T},(1,0,1)^\mathrm{T}$;
|
|
|
|
|
> 而 $(E-A)\boldsymbol x=\boldsymbol 0$,即$\begin{bmatrix}-2&-1&-2\\0&4&0\\-2&b&-2\end{bmatrix}\boldsymbol x=\boldsymbol 0$,对应的特征向量是 $(-1,0,1)^\mathrm{T}$;
|
|
|
|
|
> 因此,$P=\begin{bmatrix}1&1&-1\\2&0&0\\0&1&1\end{bmatrix}$.
|
|
|
|
|
> 如果 $a=1$:特征值 $1$ 的代数重数为 $2$;因为 $A$ 能相似对角化,所以相应的几何重数也为 $2$.
|
|
|
|
|
> $(E-A)\boldsymbol x=\boldsymbol 0$,即$\begin{bmatrix}-2&-1&-2\\0&0&0\\-2&-b&-2\end{bmatrix}\boldsymbol x=\boldsymbol 0$,由 $\text{rank}(E-A)=1$ 得 $b=1$,对应的特征向量为$(1,-2,0)^\mathrm{T},(1,0,-1)^\mathrm{T}$;
|
|
|
|
|
> 而 $(5E-A)\boldsymbol x=\boldsymbol 0$,即$\begin{bmatrix}-2&-1&-2\\0&4&0\\-2&b&-2\end{bmatrix}\boldsymbol x=\boldsymbol 0$,对应的特征向量是 $(1,0,1)^\mathrm{T}$;
|
|
|
|
|
> 因此,$P=\begin{bmatrix}1&1&1\\-2&0&0\\0&-1&1\end{bmatrix}$.
|
|
|
|
|
|
|
|
|
|
>[!example] 例题17
|
|
|
|
|
>设 $n$ 阶方阵 $A$ 满足 $A^2 - 3A + 2E = O$ ,证明 $A$ 可相似对角化。
|
|
|
|
|
|
|
|
|
|
>[!note] 解析
|
|
|
|
|
>$(A - 2E)(A - E) = 0$,容易得出 $A$ 的特征值只能是 $1$ 或者 $2$ 。
|
|
|
|
|
>$\therefore \text{rank}(A - 2E) + \text{rank}(A - E) \leq n$
|
|
|
|
|
>$\text{rank}((A - E) - (A - 2E)) = n \leq \text{rank}(A - E)$
|
|
|
|
|
>$\therefore \text{rank}(A - 2E) + \text{rank}(A - E) = n$
|
|
|
|
|
>$\therefore \text{dim}N(A-2E)+\text{dim}N( A - E) = n$
|
|
|
|
|
>即特征值 $2$ 和特征值 $1$ 的几何重数之和为 $n$(或者一个不是特征值而另一个几何重数是 $n$),而代数重数不小于几何重数,所以两个特征值的几何重数与代数重数只能相等,否则两个特征值的代数重数之和就会大于 $n$ ,这是不可能的。于是 $A$ 可相似对角化。
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
# Trivia
|
|
|
|
|
### 证明方阵可交换
|
|
|
|
|
#### **通用解题框架**:$AB = kA + lB$ 型等式证明 $AB=BA$
|
|
|
|
|
**步骤1**:等式变形,构造因式分解
|
|
|
|
|
把给定的等式 $AB = kA + lB$ 整理成可以因式分解的形式。
|
|
|
|
|
移项:$AB - kA - lB = O$
|
|
|
|
|
凑因子:在等式两边加上 $klE$,凑出 $(A - lE)(B - kE)$
|
|
|
|
|
$(A - lE)(B - kE) = klE$
|
|
|
|
|
这样就把等式转化为两个矩阵的乘积等于一个常数矩阵的形式。
|
|
|
|
|
**步骤 2**:证明矩阵可逆
|
|
|
|
|
上一步得到的右边 $klE$ 是纯量矩阵,说明:
|
|
|
|
|
$(A - lE)$ 和 $\frac{(B - kE)}{kl}$ 互为逆矩阵,即 $(A-lE)$ 和 $(B-kE)$ 可交换,则 $(A - lE)(B - kE) = (B - kE)(A - lE)$
|
|
|
|
|
**步骤 3**:展开等式,推导 $AB=BA$
|
|
|
|
|
把步骤2得到的可交换等式 $(A - lE)(B - kE) = (B - kE)(A - lE)$展开:
|
|
|
|
|
$AB - kA - lB + klE = BA - lB - kA + klE$
|
|
|
|
|
两边消去相同项$-kA - lB + klE$ ,直接得到:
|
|
|
|
|
$AB = BA$
|
|
|
|
|
|
|
|
|
|
>[!example] 例题18
|
|
|
|
|
>设 $A, B$ 是 3 阶矩阵,$AB = 2A - B$,如果 $\lambda_1, \lambda_2, \lambda_3$ 是 $A$ 的 3 个不同特征值。证明:
|
|
|
|
|
(1) $AB = BA$;
|
|
|
|
|
(2) 存在可逆矩阵 $P$,使得 $P^{-1}AP$ 与 $P^{-1}BP$ 均为对角矩阵。
|
|
|
|
|
|
|
|
|
|
>[!note] **证明:**
|
|
|
|
|
>(1)
|
|
|
|
|
> $\because AB = 2A - B$
|
|
|
|
|
> $\therefore (A + E)(B - 2E) = -2E$
|
|
|
|
|
> $\therefore ( B - 2E)(A + E) = (A + E)(B - 2E)$
|
|
|
|
|
> $\therefore AB = BA$
|
|
|
|
|
>(2)
|
|
|
|
|
> 设 $P^{-1}AP = \Lambda_1$,$\Lambda_1$ 为对角矩阵
|
|
|
|
|
> 则 $P^{-1}ABP = P^{-1}BAP$
|
|
|
|
|
> $\therefore P^{-1}APP^{-1}BP = P^{-1}BPP^{-1}AP$
|
|
|
|
|
> 设 $P^{-1}BP = \Lambda_2$
|
|
|
|
|
> $\therefore \Lambda_1\Lambda_2 = \Lambda_2\Lambda_1$
|
|
|
|
|
> 与对角矩阵可交换的矩阵必为对角矩阵
|
|
|
|
|
> 证毕
|
|
|
|
|
|
|
|
|
|
>[!example] 例题19
|
|
|
|
|
设 $n$ 阶方阵 $A, B$ 满足 $AB = A + B$。
|
|
|
|
|
(1)证明 $A - E$ 可逆;
|
|
|
|
|
(2)证明 $AB = BA$;
|
|
|
|
|
(3)证明 $\mathrm{rank}(A) = \mathrm{rank}(B)$;
|
|
|
|
|
(4)若矩阵$$B = \begin{bmatrix}
|
|
|
|
|
1 & -3 & 0 \\
|
|
|
|
|
2 & 1 & 0 \\
|
|
|
|
|
0 & 0 & 2
|
|
|
|
|
\end{bmatrix}$$ 求矩阵 $A$。
|
|
|
|
|
|
|
|
|
|
>[!note] 【解】
|
|
|
|
|
**(1)**
|
|
|
|
|
由 $AB = A + B$ 得 $(A - E)(B - E) = E$,因此 $A - E$ 可逆。
|
|
|
|
|
**(2)**
|
|
|
|
|
由 $(A - E)(B - E) = E$ 得 $(B - E)(A - E) = E$,因此 $AB = BA$。
|
|
|
|
|
**(3)**
|
|
|
|
|
由 $AB = A + B$ 得 $A = (A - E)B$,而 $A - E$ 可逆,故 $\mathrm{rank}(A) = \mathrm{rank}(B).$
|
|
|
|
|
**(4)**
|
|
|
|
|
由 $AB = A + B$ 得 $A(B - E) = B$,而 $B - E$ 可逆,故 $A = B(B - E)^{-1}.$
|
|
|
|
|
已知$B = \begin{bmatrix}1 & -3 & 0 \\2 & 1 & 0 \\0 & 0 & 2\end{bmatrix},$
|
|
|
|
|
则$B - E = \begin{bmatrix}0 & -3 & 0 \\2 & 0 & 0 \\0 & 0 & 1\end{bmatrix}.$
|
|
|
|
|
求逆得$(B - E)^{-1} = \begin{bmatrix}0 & \frac12 & 0 \\[2pt]-\frac13 & 0 & 0 \\[2pt]0 & 0 & 1\end{bmatrix}.$
|
|
|
|
|
于是$A = B(B - E)^{-1} = \begin{bmatrix}1 & -3 & 0 \\2 & 1 & 0 \\0 & 0 & 2\end{bmatrix}
|
|
|
|
|
\begin{bmatrix}0 & \frac12 & 0 \\[2pt]-\frac13 & 0 & 0 \\[2pt]0 & 0 & 1\end{bmatrix}= \begin{bmatrix}1 & \frac12 & 0 \\[2pt]-\frac13 & 1 & 0 \\[2pt]0 & 0 & 2\end{bmatrix}.$
|