6.2 * 特征值与特征向量
特征值和特征向量是矩阵和线性变换蕴含的最本质的信息之一,它们的计算及其性质的研究是相似标准型理论的起点. 本节我们将从6个方面来阐述相关的方法.
小老弟,看我手指这是几🖖
注: 代数基本定理保证了任一 $n(n \ge 1)$ 阶复矩阵 $A$ 或 $n$ 维复线性空间 $V$ 上的线性变换 $\varepsilon$ 至少有一个复特征向量. 如果是在数域 $\mathbb{F}$ 上,则需要 $A$ 或 $\varepsilon$ 的特征值 $\varepsilon_{0}$ 属于 $\mathbb{F}$ ,然后线性方程组的求解理论才能够保证 $\varepsilon_{0}$ 在 $\mathbb{F}^{n}$ 或 $V$ 中有对应的特征向量. 因此 ,后面如无特殊说明,总是假设在复数域$\mathbb{C}$上考虑问题
1. 直接利用定义计算和证明
6.1 设 $V$ 是 $n$ 阶矩阵全体组成的线性空间,$\varepsilon$ 是 $V$ 上的线性变换: $\varepsilon(X) = AX$ ,其中 $A$ 是一个 $n$ 阶矩阵,求证: $\varepsilon$ 和 $A$ 具有相同的特征值 (重数可能不同)
6.2 设 $\lambda_{1}, \lambda_{2}$ 是矩阵 $A$ 的两个不同的特征值, $\alpha_{1}, \alpha_{2}$ 分别是 $\lambda_{1}, \lambda_{2}$ 的特征向量,求证: $\alpha_{1} + \alpha_{2}$ 必定不是 $A$ 的特征向量
6.3 设 $\varepsilon$ 是线性空间 $V$ 上的线性变换,$V$ 有一个直和分解:
$$ V = V_{1} \oplus V_{2} \oplus \dots \oplus V_{m}, $$
其中 $V_{i}$ 都是 $\varepsilon-$不变子空间
(1) 设 $\varepsilon$ 限制在 $V_{i}$ 上的特征多项式为 $f_{i}(\lambda)$ ,求证: $\varepsilon$ 的特征多项式为
$$ f(\lambda) = f_{1}(\lambda)f_{2}(\lambda) \dots f_{m}(\lambda). $$
(2) 设 $\lambda_{0}$ 是 $\varepsilon$ 的特征值,$V_{0} = {v \in V | \varepsilon(v) = \lambda_{0}v }$ 为特征子空间,$V_{i,0} = V_{i} \cap V_{0}= {v \in V_{i} | \varepsilon(v) = \lambda_{0}v }$,求证:
$$ V = V_{1,0} \oplus V_{2,0} \oplus \dots \oplus V_{m,0}, $$
小老弟,看我手指这是几🖖
注: 如果将6.3的条件和结论映射到代数语言时,可知: 对分块对角矩阵: $A = diag{A_{1}, A_{2}, \dots, A_{m}}$ 的任一特征值$\lambda_{0}$的代数重数等于每个分块的代数重数之和,其几何重数等于每个分块的几何重数之和. 进一步还可以得到如下构造极大线性无关特征向量组(即特征子空间的一组基)的结论
6.4 设 $n$ 阶分块对角阵 $A = diag{A_{1}, A_{2}, \dots, A_{m}}$ ,其中 $A_{i}$ 是 $n_{i}$ 阶矩阵.
(1) 任取 $A_{i}$ 的特征值 $\lambda_{i}$ 及其特征向量 $x_{i} \in \mathbb{C}^{n_{i}}$,求证: 可在 $x_{i}$ 的上下添加适当多的零,得到非零向量 $\widetilde{x_{i}} \in \mathbb{C}^{n}$,使得 $A \widetilde{x_{i}} = \lambda_{i} \widetilde{x_{i}}$,即 $\widetilde{x_{i}}$ 是 $A$ 关于特征值 $\lambda_{i}$ 的特征向量,称为 $x_{i}$ 的延拓
(2) 任取 $A$ 的特征值 $\lambda_{0}$,并设 $\lambda_{0}$ 是 $A_{i1}, \dots, A_{ir}$ 的特征值,但不是其他 $A_{j}(1 \le j \le m, j \neq i_{1}, \dots, i_{r})$ 的特征值,求证: $A$ 关于特征值 $\lambda_{0}$ 的特征子空间的一组基可取为 $A_{ik} (1 \le k \le r)$ 关于特征值 $\lambda_{0}$ 的特征子空间的一组基的延拓的并集.
5. 设 $A$ 是 $n$ 阶整数矩阵, $p,q$ 为互素的整数且 $q > 1$. 求证: 矩阵方程 $Ax = \dfrac{p}{q}x$ 必定无非零解
6. 求下列 $n$ 阶矩阵的特征值
$$ A = \begin{pmatrix} 0 & a & \dots a & a\\ b & 0 & \dots a & a\\ \cdots &\cdots && \cdots & \cdots\\ b & b & \dots 0 & a\\ b & b & \dots b & 0 \end{pmatrix} $$
2. 正向利用矩阵的多项式
设 $A$ 是 $n$ 阶矩阵,$f(x) = a_{m}x_{m} + a_{m-1}x_{m-1} + \dots + a_{1}x + a_{0}$ 是多项式,定义
$$ f(A) = a_{m}A^{m} + a_{m-1}A^{m-1} + \dots + a_{1}A + a_{0}I_{n} $$
矩阵 $A$ 的特征值与矩阵 $f(A)$ 的特征值之间有着密切的关系,这就是例题6.7
6.7 设 $n$ 阶矩阵 $A$ 的全体特征值为 $\Lambda_{1}, \lambda_{2}, \dots, \lambda_{n}$ ,$f(x)$ 是一个多项式,求证: $f(A)$ 的全体特征值为 $f(\Lambda_{1}), f(\lambda_{2}), \dots, f(\lambda_{n})$.
小老弟,看我手指这是几🖖
注: 一般一个结论,我们都需要从多个角度考虑,最常见是正反两个方面,比如6.7告诉我们对于一个矩阵的多项式,他的特征值就是矩阵特征值的多项式,仔细观察条件“矩阵和矩阵的多项式(函数)”,我们先入的理解是先有矩阵,再有矩阵的多项式,但是这并不是所有情况,比如有可能先有矩阵的多项式,再有矩阵,也就是说能把矩阵 写成一个简单矩阵的多项式,那么就可以根据简单矩阵的特征值得到复杂矩阵的特征值. 当然,这其实是废话,但凡受过一点数学教育也能看出来,不过技巧都是朴实的
8. 设 $n$ 阶矩阵 $A$ 的全体特征值为 $\Lambda_{1}, \lambda_{2}, \dots, \lambda_{n}$ ,求 $2n$ 阶矩阵
$\begin{pmatrix} A & A^{2}\\ A^{2} & A \end{pmatrix} $ 的全体特征值
9. 求下列循环矩阵的特征值
$$ A = \begin{pmatrix} a_{1} & a_{2} & a_{3} & \dots & a_{n} \\ a_{n} & a_{1} & a_{2} & \dots & a_{n-1} \\ a_{n-1} & a_{n} & a_{1} & \dots & a_{n-2} \\ \cdots &\cdots & \cdots & & \cdots\\ a_{2} & a_{3} & a_{4} & \dots & a_{1} \end{pmatrix} $$
10. 设矩阵 $A$ 的特征多项式为 $f(\lambda)$ ,$A$ 的全体特征值为 $\Lambda_{1}, \lambda_{2}, \dots, \lambda_{n}$ ,$g(\lambda)$ 为任一多项式. 证明: 矩阵 $g(A)$ 的行列式等于 $f(\lambda), g(\lambda)$ 的结式 $R(f,g)$
小老弟,看我手指这是几🖖
注: 分析6.10可知,若 $f(\lambda) g(\lambda)$ 互素,则 $|g(A)| = R(f,g) \neq 0$,从而 $g(A)$ 是非异阵. 进一步讨论还可以参考例6.84
11. 设首一多项式 $f(x) = x_{n} + a_{n-1}x_{n-1} + \dots + a_{1}x + a_{0}$ 的友阵
$$ A = \begin{pmatrix} 0 & 0 & \dots & 0 & -a_{0} \\ 1 & 0 & \dots & 0 & -a_{1} \\ 0 & 1 & \dots & 0 & -a_{2} \\ \cdots &\cdots & & \cdots & \cdots\\ 0 & 0 & \dots & 1 & -a_{n-1} \end{pmatrix} $$
3. 反向利用矩阵的多项式
6.12 设 $n$ 阶矩阵 $A$ 适合一个多项式 $g(x)$ ,即 $g(A) = O$. 求证: $A$ 的特征值 $\lambda_{0}$ 也适合 $g(x)$ 即$g(\lambda_{0}) = 0$
小老弟,看我手指这是几🖖
分析6.12可知,可以由 $A$ 适合的多项式得到 $A$ 可能的特征值. 一般地,还可以由 $g(A)$ 的特征值的约束条件得到 $A$ 的特征值的约束条件. 下面几个例题是应用这一技巧的典型例题
6.13 求证: 矩阵 $A$ 是幂零矩阵的充要条件是 $A$ 的特征值全为零
6.14 设 $V$ 是数域 $\mathbb{F}$ 上的全体 $n$ 阶方阵构成的线性空间,有 $n$ 阶方阵
$$
A = \begin{pmatrix}
0 & \dots & 0 & 1 \\
0 & \dots & 1 & 0 \\
\cdots &\cdots & & \cdots & \cdots\\
1 & \dots & 0 & 0
\end{pmatrix}
$$
,
$V$ 上的线性变换 $\eta(X) = PX^{’}P$. 试求 $\eta$ 的全体特征值及其特征向量
6.15 设 $n$ 阶方阵 $A$ 的每行每列只有一个元素非零,并且那些非零元素为1或$-1$. 求证: $A$ 的特征值都是单位根
6.16 设 $A$ 是 $n$ 阶实方阵,又 $I_{n} - A$ 的特征值的模长都小于1求证: $0 \le |A| \le 2^{n}$
6.17 设 $n$ 阶可逆矩阵的全体特征值为 $\lambda_{1}, \lambda_{2},\dots , \lambda_{n}$ ,求证: $A^{-1}$ 的全体特征值为 是 $\lambda_{1}^{-1}, \lambda_{2}^{-1},\dots , \lambda_{n}^{-1}$
6.18 伴随矩阵 $A^{}$ 的特征值和原矩阵 $A$ 的特征值有着如下关系: 设 $n$ 阶矩阵 $A$ 的全体特征值为 $\lambda_{1}, \lambda_{2},\dots , \lambda_{n}$,求证: $A^{}$ 的全体特征值为 $\prod_{i \neq 1}lambda_{i}, \prod_{i \neq 2}\lambda_{i},\dots , \prod_{i \neq n}\lambda_{i}$
4. 特征值的降阶公式
求 $n$ 阶矩阵 $A$ 的特征值等价于计算特征多项式 $|\lambda I_{n} - A|$,这是一个 $n$ 阶文字行列式,第一章阐述的十余种求行列式的方法都可以用. 这里我们重点介绍用行列式的降阶公式来求某类矩阵的特征多项式,下面的例题称为特征值的降阶公式
6.19 (特征值的降阶公式)
设 $A$ 是 $m \times n$ 矩阵,$B$ 是 $n \times m$ 矩阵,且 $m \ge n$
$$ |\lambda I_{m} - AB| = \lambda^{m-n}|\lambda I_{n} -BA | $$ 特别地,若 $A,B$ 都是 $n$ 阶矩阵,则 $AB$ 与 $BA$ 有相同的特征多项式
20. 设 $\alpha$ 是 $n$ 维实列向量且 $\alpha^{’}\alpha = 1$,试求矩阵 $I_{n} - 2\alpha^{’}\alpha $ 的特征值.
21. 设 $A$ 为 $n$ 阶方阵,$\alpha, \beta$ 为 $n$ 维列向量,试求矩阵 $A\alpha\beta^{’}$ 的特征值
22. 设 $\alpha_{i}(1 \le i \le n)$ 都是实数,且 $a_{1} + a_{2} + \dots + a_{n} = 0$,试求下列矩阵的特征值:
$$ A = \begin{pmatrix} a_{1}^{2} & a_{1}a_{2}+1 & \dots & a_{1}a_{n}+1\\ a_{2}^{1}+1 & a_{2}^{2} & \dots & a_{2}a_{n}+1\\ \cdots &\cdots & & \cdots\\ a_{n}a_{1} & a_{n}a_{2}+1 & \dots & a_{n}^{2} \end{pmatrix} $$
小老弟,看我手指这是几🖖
在例6.19的3种证法中(详情见书300页),我们用了分块矩阵的方法,这在特征值的理论分析中是一种常用的方法,为了使读者有更深的印象,我们再给几个例子
6.23 设 $A,B,C$ 分别是 $m \times m, n \times n, m \times n$ 矩阵,满足: $AC = CB, r(C) = r$ ,求证:$A$ 和 $B$ 至少有 $r$ 个相同的特征值
5. 特征值与特征多项式的关系
下面的例题描述了特征值与特征多项式的系数之间的关系
6.24 设 $n$ 阶矩阵 $A$ 的特征多项式为
$$ f(\lambda) = \lambda^{n} + a_{1}\lambda_{n-1} + \dots + a_{n-1}\lambda + a_{n} $$
求证: $a_{r}$ 等于 $(-1)^{r}$ 乘以 $A$ 的所有 $r$ 阶主子式之和,即
$$ a_{r} = (-1)^{r} \sum_{1 \le i_{1} < i_{2} <\dots < i_{r} \le n} A \begin{pmatrix} i_{1} & i_{2} & \dots & i_{r}\\ i_{1} & i_{2} & \dots & i_{r} \end{pmatrix} (1 \le r \le n) $$
进一步,若设 $A$ 的特征值为 $\lambda_{1}, \lambda_{2}, \dots, \lambda_{n}$ ,则
$$ \sum_{1 \le i_{1} < i_{2} <\dots < i_{r} \le n} \lambda_{i1} \lambda_{i2} \dots \lambda_{ir} = \sum_{1 \le i_{1} < i_{2} <\dots < i_{r} \le n} A \begin{pmatrix} i_{1} & i_{2} & \dots & i_{r}\\ i_{1} & i_{2} & \dots & i_{r} \end{pmatrix} (1 \le r \le n) $$
小老弟,看我手指这是几🖖
上述结论中最常见的就是$r = 1, r = n$
$$ \sum_{i = 1}^{n} \lambda_{i} = tr(A), \prod_{i = 1}^{n} \lambda_{i} = |A| $$
再补充一下,特别地,$A$ 是非异阵的充要条件是 $A$ 的特征值全都不为零. 因此特征值是计算非异性的第五种方法(参考2.4节可逆矩阵),下面给出两个例题进行说明
6.25 设 $n$ 阶方阵 $A$ 满足 $A^{2} - A - 3I_{n} = O$,求证: $A - 2I_{n}$ 是非异阵.
3.82 ,3.84 设 $A$ 是 $n$ 实对称矩阵,$S$ 是 $n$ 实反对称矩阵,求证: $I_{n} \pm S$ 和 $I_{n} \pm iA$ 都是非异阵
6.26 设 $P$ 是可逆阵,$B = PAP^{-1} - P^{-1}AP$ ,求证: $B$ 的特征值之和为零.
27 设 $n$ 阶实方阵 $A$ 的特征值全是实数,且 $A$ 的一阶主子式之和与二阶主子式之和都等于零. 求证: $A$ 是幂零矩阵
28. 设 $n(n \ge 3)$ 阶非异实方阵 $A$ 的特征值都是实数,且 $A$ 的 $n-1$ 阶主子式之和等于零. 证明: 存在 $A$ 的一个 $n-2$ 阶主子式,其符号与 是 $|A|$ 的符号相反
根据$tr(A^{k})$ 确定 $A$ 的特征值
设 $n$ 阶方阵 $A$ 的特征值为 $\lambda_{1}, \lambda_{2}, \dots, \lambda_{n}$ 则对任意的正整数 $k$,$A^{k}$ 的特征值 $\lambda_{1}^{k}, \lambda_{2}^{k}, \dots, \lambda_{n}^{k}$,于是特征值的 $k$ 次幂和
$$ s_{k} = \lambda_{1}^{k} + \lambda_{2}^{k} + \dots + \lambda_{n}^{k} = tr(A^{k}), k \ge 1 $$
由 $Newton$ 公式可以计算出特征值的初等对称多项式
$$ \sigma_{r} = \sum_{1 \le i_{1} < i_{2} <\dots < i_{r} \le n} \lambda_{i1} \lambda_{i2} \dots \lambda_{ir}, 1 \le r \le n $$
从而可以确定特征多项式的系数,最后便可计算出 $A$ 的所有特征值,下年我们来看由 $tr(A)$ 确定 $A$ 的特征值的几道例题
29. 设 $A$ 是 $n$ 阶对合矩阵,即 $A^{2} = I_{n}$ ,证明: $n - tr(A)$ 为偶数,并且 $tr(A) = n$ 的充要条件是 $A = I_{n}$
30. 设4阶方阵 $A$ 满足 $tr(A^{k}) = k(1 \le k \le 4)$,试求 $A$ 的行列式
31. 求证: $n$ 阶矩阵 $A$ 为幂零矩阵的充要条件是 $tr(A^{k}) = 0(1 \le k \le n)$
32. 设 $A, B, C$ 是 $n$ 阶矩阵,其中 $C = AB - BA$. 若他们满足条件 $AC = CA, BC = CB$,求证: $C$ 的特征值全为零. 又若将条件减弱为 $ABC = CAB, BAC = CBA$,则上述结论不再成立
小老弟,看我手指这是几🖖
注: 从上述证明不难看出: 只需要 $AC = CA, BC = CB$ 这两个条件中的一个就能证明本题的结论. 如果这两个条件都有,我们将在后面给出另外两个证明: 分别是一个利用矩阵乘法交换性诱导的同时性质,另一个是 $Jordan$ 标准型理论的应用. 另外我们还将证明: $A, B, C$ 可同时上三角化