一、线性空间与线性变换

1. 线性空间

线性空间:设是一个非空的集合,是一个数域,在集合中定义加法(+)和数乘()两种运算,如果这两种运算满足加法交换律、加法结合律、数乘结合律、两个分配律,0元存在,1元存在,负元存在这八条运算律,则称为线性空间。线性空间满足对加法和乘法的封闭性。

(1)加法交换律:. (2)加法结合律:. (3)数乘结合律:. (4)分配律1:. (5)分配律2:. (6)零元素:. (7)1元素:. (8)负元素:.

例如:

函数空间:全体实函数集合构成 实数域上的线性空间。

矩阵空间:复数域上的全体矩阵构成的集合上的线性空间。

多项式空间:实数域上全体次数小于或等于的多项式集合构成实数域上的线性空间。

2. 基、维数

基、坐标、维数

若设线性空间中存在个线性无关的向量,使得中任意一个向量都可以由线性表示,即,则称的一个,称为向量在基下的坐标,称为一个线性空间,记作.

维数是矩阵中自由量的个数,比如的矩阵,它的维数一般是4;但是如果加了约束条件,比如的对称矩阵,那么它的维数是3.

线性空间的基并不唯一,证明一组向量是线性空间的基,两步走:

基变换

维线性空间中的两组基,它们的关系为

写成矩阵的形式为

称矩阵是由过渡矩阵

过渡矩阵是可逆的,若,则.

坐标变换

任取,若在基上的坐标为,在基上的坐标为,则

与基变换对应,坐标变换可以写成.

例:在4维线性空间中,有两组基,求从基到基的过渡矩阵,并求向量在这两组基下的坐标。

解:4维空间的过渡矩阵是的,利用性质得

算出

设向量在第一组基下的坐标为,则

算出

向量在第二组基下的坐标为.

3. 线性子空间、维数公式

是数域上的一个维线性空间,的一个非空子集,如果对任意的,都有,则称上的i一个子空间。(也就是说,要验证子空间,只需验证对加法和乘法封闭即可)

比如

列空间R(A):由矩阵的列组成的列向量的生成空间;列向量的线性组合可以表示为,因此

核空间N(A):核空间为解空间,比如,解空间的基是的基础解系,维数是基础解系所含向量的个数,称为的零度。

子空间的交、和:设是线性空间的两个子空间,则

直和子空间:如果,且,则称的直和子空间,记作

直和补子空间:对于的任意子空间,都存在中的子空间,使得成立,此时称的直和补子空间。

维数公式

4. 线性映射

线性映射:若存在映射,对于线性空间上的任意两个向量,都有(1)(2),则称是从线性映射,称原像

线性相关,则也线性相关。(因为

核空间可以用映射来定义:

的线性映射(),则的线性子空间,称为线性映射值域,记作,若令,则的线性子空间,称为线性映射核子空间称为零度

秩与零度定理:设维线性空间维线性空间的线性映射,则.

线性变换:设是从的一个线性映射,则称是线性空间的线性变换。

线性变换的矩阵表示:设的线性变换,的一组基,于是可以用这组基线性表示:;写成矩阵的形式:阶方阵称为下的矩阵表示。(简称为在某基下的矩阵)

例:在中,基选取,求微分运算的矩阵表示

解:微分运算是一种线性变换,这里线性映射是微分运算,先算出基的微分,再用原来的基表示出来,就可以写出矩阵表示

,于是矩阵为.

同一线性变换在不同基下的矩阵之间的关系:设的线性变换,的两组基,由的过渡矩阵为在基下的矩阵为,则在下的矩阵.

证明:

由于线性无关,所以.

5. 特征值、特征向量

阶方阵,若存在数元非零列向量,使得,则称的特征值,称属于的特征向量。

相关定义:

性质1:

性质2:

(此时仍是分别对应于的特征向量)

特征子空间阶矩阵的属于的全部特征向量再添上零向量,可以组成的一个子空间,称之为矩阵的属于特征值的特征子空间,记作。(不难看出,是特征方程组的解空间)

代数重复度:设个互不相同的特征值,对应的重数分别为,则称的代数重复度。(因此可以把特征多项式写成

几何重复度:特征子空间的维数称为的几何重复度,

性质3:

6. 相似、对角化

相似对角化的条件与对角阵相似,则称可对角化,也可以称单纯矩阵阶矩阵可相似对角化的充要条件是有个线性无关的特征向量(或每一个特征值的几何重复度等于代数重复度)(推论:无重根则一定可以相似对角化)。

引理:对于分块矩阵可对角化的条件是都可以对角化。

两个相似的矩阵它们的行列式的值相同、秩相同、特征值相同且对应的特征向量也相同。

同时对角化的条件:若存在可逆矩阵,使得都是对角阵,则称可同时对角化。可同时对角化的充要条件是。(也就是说,当时,有相同的特征向量)

例:判断是否可以相似对角化

解:,即(二重),其中一定对应一个线性无关的特征向量,只需考虑

,故

几何重复度不等于代数重复度,故不能相似对角化。

二、Jordan标准形

1. -矩阵

-矩阵:设)为数域上的多项式,则称多项式矩阵,或-矩阵。其中中最高次数为的次数

比如特征矩阵就是一个-矩阵。

-矩阵的初等变换

(和数字矩阵类似,每种初等变换都有对应的可逆的初等矩阵,且一个矩阵左乘初等矩阵相当于作初等行变换,右乘相当于作初等列变换)

-矩阵的等价:如果经过有限次初等变换之后变成,则称等价,记作

(和数字矩阵类似,等价具有自反性、对称性、传递性

2. 不变因子、行列式因子、初等因子

-矩阵的Smith标准型:任意一个非零的-矩阵都等价于一个“对角矩阵”,即,其中是首项系数为1的多项式,且(该记号表示能被整除),这种形式的矩阵称为Simth标准型称为不变因子

比如就不是Simth标准型(因为不能被整除),作初等变换后变成后才是Simth标准型。

行列式因子:设的全部阶子式()的最大公因式称为阶行列式因子(要求首项系数为1)。显然,秩为矩阵行列式因子一共有个。

例:求的各阶行列式因子

解:每个位置上的元素都构成一个一阶行列式因子,比如是互素的,所以它们的最大公因式.

行列式总共有9个二阶子式,大部分子式至少都有,考虑两个特殊的,,它们的最大公因式是,所以.

三阶子式就是这个矩阵的行列式,,所以.

观察可知,的因式,的因式,,该结论对任意-矩阵都适用。

初等因子:对于-矩阵的不变因子,在复数域内将它们分解成一次因式的幂的乘积:,其中是互异的复数,是非负整数,所有指数大于零的因子称为-矩阵的初等因子。

由于,所以一定可以写成上面的形式,而且.

例:若-矩阵的不变因子为,,则它的初等因子为.

例:若已知矩阵的秩为4,其初等因子为,求它的Simth标准型

解:

故其Simth标准型为:.

特别地,对于分块对角-矩阵各个初等因子的全体,就是的全部初等因子。

对角型矩阵可以很快地写成Simth标准型,例如,可以看作是分块大小为1的分块对角-矩阵,分块的全体初等因子为,故其Simth标准型为.

定理:等价的-矩阵有相同的各阶行列式因子,从而有相同的秩。(证明思路:证各种初等变换都不改变行列式因子)

根据Simth标准型的性质,于是-矩阵的.

或者写成.

定理:-矩阵的Simth标准型是唯一的。

定理:等价的充要条件是它们有相同的各阶行列式因子

定理:等价的充要条件是它们有相同的不变因子

定理:等价的充要条件是它们有相同的和相同的初等因子

有时利用行列式因子可以方便地求出Simth标准型,而不需要作复杂的初等变换

例:求的Simth标准型,其中

解:它是一个对角阵,

观察矩阵,有一个特殊的阶子式,去掉第一列和最后一行的子式,它是一个对角阵,行列式的值为,故,于是根据性质知,,因此.

数字矩阵的相似与-矩阵的关系:设是两个阶数字矩阵,那么相似的充要条件是它们的特征矩阵等价。

数字矩阵的不变因子、初等因子:对于数字矩阵,称的不变因子为的不变因子,称的初等因子为的初等因子。

定理:两个同阶方阵相似的充要条件是它们有相同的各阶行列式因子

定理:两个同阶方阵相似的充要条件是是它们有相同的不变因子

定理:两个同阶方阵相似的充要条件是它们有相同的初等因子。(由于特征矩阵行列式的值不为0,故,因此不需要秩相同的条件)

3. 方阵的Jordan标准型

如果一个方阵可以相似对角化,则可以通过的一些性质间接得到的一些性质,从而简化计算。同理,如果可以写成,就可以用Jordan标准型的一些性质简化计算。

Jordan标准型:准对角矩阵称为Jordan标准型,其中阶矩阵为Jordan块,的行列式因子为,故的初等因子为的初等因子为

矩阵相似于Jordan标准型的条件:若,且的初等因子为,则,其中是Jordan块。

若不考虑Jordan块的排列顺序,则Jordan标准型是唯一的。

推论:阶矩阵可以对角化的充要条件是的初等因子都是一次因式

Jordan标准型的求法

(1)求出初等因子,然后根据初等因子与Jordan标准型的关系直接写出Jordan标准型.

(2)Jordan标准型对角线上的元素是矩阵的特征值,先算出特征值,然后讨论如何分块.

例:求的Jordan标准型

解:先求出的初等因子,,得出的初等因子为,故的Jordan标准型为,或.

例:求的Jordan标准型

解:先求出的特征多项式及其特征值,,得出的特征值为(二重)

对于,它是的1重根,对应一个1阶的Jordan块;

对于,要讨论两个3是在一个Jordan块内还是两个Jordan块内,进而转为讨论能否对角化,先求出,几何重数,代数重数,几何重数不等于代数重数,故不能相似对角化,因此这两个3一定在一个Jordan块内。

故Jordan标准型为.

Jordan标准型的相似变换矩阵:若阶方阵的Jordan标准型为,存在可逆矩阵使得,则称为相似变换矩阵。下面通过例题说明求解的方法

例:求的Jordan标准型及其相似变换矩阵

解:,初等因子为,故Jordan标准型为.

设相似变换矩阵按列分块写成,根据得到,从而得到,整理后可得方程组,前两条为同解方程,可算出它们的基础解系为,因此可以选取,但是不能简单地取,因为如果选取不当,会使第三条方程无解,因为可以由基础解系线性表示,令,要使第三条方程有解,要满足,由于,可取,此时,代入方程组最后解出特解,故相似变换矩阵.

先了解Jordan标准型的几个性质

比如,则

证明:设的特征根对应的Jordan块有个,则(因为对角线上的变成零),的几何重复度为,即.

根据以上性质,可以得出求解Jordan标准型的另一种方法

(1)计算,得出.

(2)通过分析得出对应于特征值的Jordan块的个数、阶数.

例:已知10阶矩阵的特征多项式,求Jordan标准型

解:只知道特征多项式是无法得知初等因子的,因此无法得知如何分块,要作以下讨论

时,①;②;③;④。因此对于的Jordan块共有块,由②知=2的Jordan块阶数的有块,由③知的Jordan块阶数的有块,由④知的Jordan块最高阶数为3阶,因此的Jordan块分别为3阶1块,2阶2块,共3块。

时,⑤;⑥;⑦。由⑤知的Jordan块共有块,由⑥知的Jordan块阶数的有块,由⑦知的最高阶数为2阶,因此的Jordan块分别为2阶1块,1阶1块,共2块。

4. Jordan标准型的应用

解微分方程组

若有微分方程组,把它写成矩阵的形式,其中,设的Jordan标准型,即,令,其中,代入微分方程的矩阵得,从而。算出后,代入即可解出

例:求下面微分方程组的解

解:写成的形式,其中,算出的Jordan标准型

,由,求得,代入

的Jordan标准型

上的阶方阵,且存在正整数使得,则与对角阵相似,且对角线上元素均为次单根。

证明:若存在可逆矩阵,使得,根据,得,由于,要使,则只能为一阶,故与对角阵相似,均为次单根。

例:若阶方阵满足,则

证:由于,故只能为1阶,而且可以得到,即是一个对角矩阵且主对角线上的只能是0或1,适当调换主对角线上的元素可以得到.

三、内积空间、正规矩阵、Hermite矩阵

1. 内积空间

内积(欧氏空间):设是实数域上的维线性空间,对于中任意两个向量,按某一确定的法则对应着一个实数,这个实数称为的内积,记为,要求该法则满足下列运算条件:

这里中任意向量,为任意实数,我们称带有这样内积的维线性空间欧氏空间

欧氏空间不是唯一的,只要满足上面的运算条件的映射都是欧氏空间,比如

(1)设,若规定,容易验证上的内积,从而是一个欧氏空间。

(2)若规定,则也是上的内积,这样的又成为另一个欧氏空间。

(3)容易验证,也可以构成欧氏空间。

(4)类似的,也可以构成欧氏空间。

其中符号“”表示定义为。

内积(酉空间):设是复数域上的维线性空间,对于中任意两个向量,按某一确定的法则对应着一个复数,这个复数称为的内积,记为,要求该法则满足下列运算条件:

这里中任意向量,为任意实数,我们称带有这样内积的维线性空间酉空间

酉空间也不是唯一的,比如

(1)设,若规定,容易验证上的内积,从而是一个酉空间。

(2)在维线性空间中,规定,其中表示矩阵中的元素取共轭后再转置,这样的也可以构成酉空间。

(3)设表示闭区间上的所有连续复值函数组成的线性空间,若规定,则也可以构成酉空间。

其中表示矩阵中元素取共轭后再转置,这个符号在后面会用到。

一般地,我们这样定义内积:设维酉空间,是其一组基,对于中任意两个向量,那么的内积为,令,把写成矩阵的形式,我们称为基度量矩阵,根据定义可知,.

2. Hermite矩阵

复共轭转置矩阵:设,用表示以中元素的共轭复数为元素组成的矩阵,记,则称的复共轭转置矩阵,有如下性质:

Hermite矩阵:设,若,则称Hermite矩阵(简称H-阵);若,则称反Hermite矩阵(简称反H-阵)。

这个定义和实对称矩阵和反实对称矩阵是对应的。若不考虑对角线上的元素,H-阵互为共轭(实部相同,虚部互为相反数),反H-阵反共轭(实部互为相反数,虚部相同)。

实对称矩阵可以看作是特殊的H-阵,欧式空间和酉空间的度量矩阵也是H-阵。

任意矩阵都可以表示为

3. 向量的长度、Schmidt正交化

向量的长度:设为酉空间(或欧氏空间),向量的长度为非负实数,向量的长度有如下性质:

一般地,我们将向量的长度定义为,这里表示复数的模长.

向量的夹角:设为欧式空间,向量非零向量的夹角定义为,根据柯西-施瓦茨不等式可知,.

向量的正交:在酉空间中,如果,则称正交,记作.

单位化:长度为1的向量称为单位向量,对于任意一个非零的向量,向量总是单位向量,这个过程叫单位化。

正交向量组:设为一组不含有零向量的向量组,如果内的任意两个向量彼此正交,则称其为正交向量组。

正交向量组是一个线性无关的向量组。

标准正交向量组:如果一个正交向量组中任何一个向量都是单位向量,则称此向量组为标准正交向量组。

标准正交基:在维空间中,由个正交向量组成的基称为正交基;由个标准的正交向量组成的基称为标准正交基。

Schmidt正交化与单位化:设维内积空间中的个线性无关的向量,利用这个向量可以构造与之等价的一个标准正交向量组,而且它是的一个标准正交基。构造的过程如下

4. 酉矩阵

酉矩阵:酉矩阵是复数域上的正交矩阵,设是一个阶复矩阵,如果满足,则称是酉矩阵(又叫U-阵),一般记为.

酉矩阵的充要条件:设是一个酉矩阵(正交矩阵)的充要条件是个列(或行)向量组是标准正交向量组。

酉矩阵的性质(设):

Householder矩阵:设,且,如果,则是一个酉矩阵,通常称这样的酉矩阵为Householder矩阵。

对比正交矩阵:设是一个阶实矩阵,若,则称是正交矩阵,一般记为.

正交矩阵的行、列向量组都是标准正交向量组。

正交矩阵的性质(设):

(2)的证明:,同时转置得,两边同时右乘,得,由于,代入得,即,由于是列向量各元素的平方和,且特征向量,,故.

正交矩阵分为两类:设,则(1).(2).这里均为正交矩阵。同样,即使,也可以分为两类,(1)时,.(2)时,.

酉矩阵(正交矩阵)的几何意义:保持向量内积、长度、夹角不变。

比如,设是列向量,若令,则.

5. 幂等矩阵、投影变换

幂等矩阵:设,如果,则称是一个幂等矩阵。(由它的jordan标准型可知,它的特征值都是1或0)

幂等矩阵的性质:

性质(3)的证明:设,则根据核子空间的性质知,,于是,因此,故;设,则存在使得,于是,故;整理得.

性质(5)的证明:设,则,代入得,故。该性质还可以写成,设,则,其中,根据性质3可知.

幂等矩阵的结构定理:设是一个秩为阶矩阵,那么为一个幂等矩阵的充要条件是存在,使得.

推论:设是一个阶幂等矩阵,则.

投影变换:设维酉空间上的两个子空间,且,则对于中任一向量均可唯一表示为,称沿的投影,沿投影。由上式确定的投影变换称为沿投影变换

幂等矩阵与投影变换的关系:设是一个阶幂等矩阵,则线性变换沿着的投影变换。

证明:,其中.

定理:则下列命题等价(设维酉空间上的线性变换)

从1到2的证明:设沿的投影变换,,则

从2到1的证明:反过来证,,从而,并且;然后再证明是直和,设,则使得,那么,由于,故,所以是直和。

从2到3的证明:设上的一组基,在该基下的矩阵表示,于是,又,且线性无关,所以.(从3到2反过来即可)

空间的正交:设维酉空间的两个子空间,若对任意的,都有,则称是正交的。

正交和:设维酉空间的两个子空间,若是正交的,则称为的正交和。(显然是直和)

正交投影:设维酉空间是子空间的正交和,对任意,有,则线性(投影)变换称为由的正交投影。(由于正交补是唯一的,所以不需要说明沿

幂等矩阵与正交投影变换的关系:设是一个阶幂等的H-矩阵,则线性变换的正交投影变换。

证明:前面已经证明过幂等则是投影变换了,这里只需证明正交,,设使得,则.

6. Schur引理与不等式

正交相似:设,若存在使得,则称正交相似于.

酉相似:设,若存在,使得,则称酉相似于.

Schur引理:任何一个阶复矩阵酉相似于一个上(下)三角矩阵。

Schur不等式:设为矩阵的特征值,那么.(当且仅当酉相似于对角矩阵时等号成立,且为充要条件)

7. 正规矩阵

正规矩阵:设,如果,那么称矩阵为正规矩阵。

实正规矩阵:设,如果,那么称矩阵为实正规矩阵。

关于正规矩阵的一些结论:

正规矩阵的结构定理:设,则是正规矩阵的充要条件是,存在一个酉矩阵,使得,其中的特征值。

证明:根据Schur引理,一定酉相似于一个三角矩阵,是正规矩阵,根据前面结论知,和它酉相似的这个三角矩阵也是正规矩阵,再由于如果正规矩阵是三角矩阵,那它就一定是对角矩阵。

推论1:阶正规矩阵有个线性无关的特征向量(必要不充分)。

推论2:正规矩阵属于不同特征值的特征向量彼此正交

定理:设是正规矩阵,则

(如果不是正规矩阵,则上面充分性不满足,但是必要性是成立的)

证明:

可知

(1)对于H-阵,,也就是说为实数。(反-H阵的证明同理)

8. Hermite矩阵的结构定理、次酉矩阵

性质:设,则

定理:

H-阵的结构定理:设,则是H-阵的充要条件是存在一个酉矩阵,使得,其中且为的特征值。(即H-阵酉相似于一个实对角矩阵)

推论:实对称矩阵正交相似于实对角矩阵。

次酉矩阵:设为一个元标准正交列向量组,那么称型矩阵为一个次酉矩阵,一般记作.

次酉矩阵的充要条件的充要条件是.

证明:,由于当,该矩阵为的单位阵.

同时是H-矩阵和幂等矩阵的充要条件:设是一个阶矩阵,则的充要条件是存在一个型次酉矩阵,使得,其中.

证明:根据幂等矩阵的性质知,幂等矩阵一定酉相似于一个分块对角阵,,变形得.

9. Hermite二次型

定义:有个复变量、系数为复数的二次齐次多项式,称为Hermite二次型,其中规定。如果记,那么这个Hermite二次型可以记作,这时称Hermite二次型对应的矩阵,并称的秩为Hermite二次型的秩

写矩阵表示,比如:.

对应Hermite二次型,可作可逆的线性替换,则,这里,且,此时称复合同(复相合)。

标准型:Hermite二次型中只含有纯平方项无交叉项的二次型称为Hermite二次型的标准型。

规范型:Hermite二次型中只含有纯平方项无交叉项而且系数只有1、-1、0的二次型称为Hermite二次型的规范型。

定理1:对于任意一个Hermite二次型,必定存在酉线性替换,将Hermite二次型化为标准型,并且是H-阵的特征值。

定理2:对于任意一个Hermite二次型,必定存在可逆的线性替换,可以将Hermite二次型化为规范型,其中.

正定Hermite二次型:对于,如果对于任意不全为零的复数都有,则称该Hermite二次型为正定的,并称对应的H-阵为正定的。(如果,则为半正定的Hermite二次型,为半正定的)

如果一个矩阵是正定的,那它一定是一个H-阵,且可逆的线性替换不改变二次型的定性

比如:是正定的;是半正定的(如果令,则)。

定理:下列命题等价(是Hermite二次型)

证明:(2)可逆的线性替换不改变二次型的定性(3)可以通过酉线性替换为标准型,由于是正定的,系数为特征值一定大于零(4)通过可逆的线性替换化为规范型,系数只能是1、-1、0,再由于正定,系数只能为1,所以是单位阵(5)由4可得

正定的充要条件阶的Hermite矩阵(或实对称矩阵)正定的充要条件是个顺序主子式全大于零,即.

例1:证明如果是一个正定的H-阵,且又是酉矩阵,则

解:因为是一个的H-阵,根据H-阵的结构定理知,必存在酉矩阵,使得一定是实数,且由于是正定的,所以,又由于是酉矩阵,所以,故只能为1,,由于是酉矩阵,所以,故.

例2:若如果是一个正定的H-阵,是一个反H-阵,证明的特征值实部全部为零

解:由于是正定的H-阵,所以存在可逆矩阵使得,那么相似,从而它们有相同的特征值,由于是一个反H-阵,所以也是一个反H-阵,根据正规矩阵中反H-阵的充要条件可知,反H-阵的特征值实部都是零,得证。(的证明同理)

例3:设是一个正定的H-阵,是一个反H-阵,证明是可逆矩阵

解:证明可逆就是要证明矩阵的行列式的值不为零。由于正定,所以存在可逆矩阵使得,由于是反H-阵,也是一个反H-阵,它的特征值实部为零,它加上单位阵后特征的实部就变为1,它的行列式的值是特征值相乘,故,因此可逆。

和正定对应,半正定Hermite二次型的性质:下面命题等价(是Hermite二次型):

定理:设是正定(半正定)Hermite矩阵,那么存在唯一正定(半正定)Hermite矩阵,使得.

证明:存在酉矩阵,使得(半正定则),定义即可。

10. Hermite矩阵偶在复合同下的标准型

定理:设均为阶H-阵,且是正定的,则必存在,使得同时成立,其中是与无关的实数(但不是特征值,而是相对于的广义特征值)。

证明:由于是正定的H-阵,根据性质知,存在使得,由于是H-阵,根据结构定理知,存在使得,其中个实特征值,此时,记,可得上面的表达式。

由于,所以的特征根值的根相同,完全由决定,与无关。

Hermite矩阵偶在复合同下的标准型(即用二次型的语言来描述前面的定理):对于给定的两个Hermite二次型,且其中是正定的,则存在非退化的线性替换,可以将同时化为标准型,此时,其中是方程的根,而且全为实数。

定义:设均为阶Hermite矩阵,且是正定的,则方程有非零解的充要条件是:次代数方程的根,我们称此方程为相对于的特征方程,它的根称为相对于广义特征值,将代入到方程中,所得非零解向量称为于相对应的广义特征向量

广义特征值于广义特征向量的性质:

性质(3)的理解:是H-阵且是正规矩阵,正规矩阵属于不同特征值的特征向量相互正交,与它酉相似的对角矩阵的主对角元就是这个矩阵的特征值,酉相似的变换矩阵中的列向量实际上就是个标准的正交的特征向量,由这个标准正交的特征向量来构造成这个广义特征向量就可以了。

四、矩阵的分解

1. 矩阵的满秩分解

满秩分解定理:设(下标表示秩,即复数域上秩为阶矩阵),那么存在,使得,其中列满秩矩阵,行满秩矩阵,因此我们称此分解为矩阵的满秩分解

证明:假设的前个列向量是线性无关的,那么对只作初等行变换可以将其化为行最简型,由于初等行变换可以写成左乘一系列初等矩阵,那么可以写成,于是.

如果的前列是线性相关的,那么先作初等列变换变成线性无关,,重复上面过程即可。

例1:求的满秩分解

解:作初等行变换得,由此可知,且该矩阵的第1、3列是线性无关的,选取.

实际上这种分解并不唯一,也可以把的第二行加到第一行上,这时就变成.

例2:求的满秩分解

解:,因此。或者

矩阵的满秩分解并不唯一,一般地,我们选取简化阶梯型主元所在的列对应的列向量构成列满秩矩阵,将阶梯型矩阵全为零的行去掉后即可构成行满秩矩阵。

定理:如果均为的满秩分解,那么

2. 矩阵的正交三角分解(UR分解)

正交三角分解定理,那么唯一地分解为,其中酉矩阵正线上三角矩阵正线下三角矩阵。(正线上三角矩阵:即主对角线上的元素都是正数的上三角矩阵)

证明:首先证明分解的存在性。将矩阵按列分块得到,由于满秩,所以线性无关,利用Schmidt正交化得到一组正交向量组,再单位化得到一组标准正交向量组,此时可以由线性表示,,其中的长度,的长度,的长度,把它写成矩阵的形式得.

再证明唯一性。设有两种分解式,,那么,注意到是酉矩阵,是正线上三角矩阵,如果一个矩阵既是酉矩阵又是正线上三角矩阵,那它必为单位阵,即,因此.

对于另一种分解,由于,所以,两边同时转置得,此时从正线上三角变为正线下三角。

推论1:如果,即列满秩,则可以唯一地分解为,其中是酉矩阵,阶正线上三角矩阵。

推论2:如果,即行满秩,则可以唯一地分解为,其中是酉矩阵,阶正线下三角矩阵。

推论3:如果,则可以分解为,其中阶正线上三角阵,是正线下三角阵。

例:求的正交三角分解

解:容易看出是列满秩的,和定理的证明过程一样,将的三个列向量正交化单位化,先正交化得,再单位化得,写出之间的关系(其实是在Schmidt正交化的方程中的系数再除以的长度),然后写成矩阵的形式,.

3. 矩阵的奇异值分解

引理1:对于任意矩阵,都有.

证明:互为共轭转置,它们的秩一定是相同的,要证明的秩相同,只需证明同解即可。左边到右边的证明只需在两边同时左乘,右边到左边的证明在两边同时左乘,其中是一个列向量,,列向量自己左乘以自己的共轭转置等于它的内积,内积为零则自身一定是零向量,代入前面两条方程可知它们是同解的。(方程组同解即解空间的维数是相同的,而解空间的维数=方程组未知数的个数-系数矩阵的秩)

引理2:对于任意矩阵,都有都是半正定的H-阵。(半正定则特征值非负)

证明:用构造一个二次型。(因为是一个维的列向量,作内积肯定大于等于零,的证明同理)

定理:设的特征值(阶矩阵),的特征值(阶矩阵),它们都是实数,记,那么),我们称)为矩阵正奇异值,简称奇异值

上面定理简单地说就是,的非零特征值相同,并且如果对应的特征向量是,那么对应的特征向量是.

证明:设,要证明的非零特征值相同,并写出特征向量之间的关系

,如果是非零列向量,那么把它看作一个整体,则的特征值,其对应的特征向量是,其中的特征向量。是一定是一个非零的列向量,否则,那么,那么特征值或特征向量为零,与假设矛盾,故也不能为零。

的非零特征值相同,且相同非零特征值的代数重数也相等。

定理:正规矩阵的奇异值为其非零特征值的模长。

推论:

证明:根据结构定理知,正规矩阵一定酉相似于一个对角阵,,两边同时取共轭转置得,两式相乘得.

例1:求的奇异值

解:,显然的特征值为5、0、0,所以的奇异值为.

例2:求的奇异值

解:,特征值为2、4,奇异值为、2.

奇异值分解定理:设个奇异值,那么存在酉矩阵酉矩阵,使得,其中,并且满足.

证明:由于,所以的特征值为,因为是H-阵,所以存在阶酉矩阵使得,将酉矩阵按列进行分块,记,其中,于是,按对应元素相等可得到,由第一条等式知酉相似,是它的相似变换矩阵(且由于,则),而第二条等式把看作一个整体,它左乘自己的共轭转置等于0,即内积为零,所以

,那么容易验证,选取使得是酉矩阵,因为正交,则

由前面得.

奇异值分解式(SVD):把称为的奇异值分解式。

留意到,即的各列向量是主对角线上特征值对应的特征向量(由于是酉矩阵,算出特征向量后还要正交化单位化);同理,

由此可知的列向量是的标准正交特征向量,的列向量是的标准正交特征向量,并且满足

由此可知的奇异值分解并不唯一。(比如重根对应的特征向量位置可以任意)

推论:设个奇异值,那么存在次酉矩阵使得.(如果是方阵则都是酉矩阵)

例1:求的奇异值分解

解:的特征值为5、0、0,所以的奇异值为,三个特征值对应的标准正交特征向量为,所以,取正交,于是.

例2:求的奇异值分解

解:由于的矩阵,比较复杂,于是令,计算的奇异值分解比较简单

,于是.

4. 矩阵的极分解

极分解定理满秩时):设,那么必存在酉矩阵正定H-阵使得,并且这样的分解是唯一的,同时有,称分解式为矩阵的极分解表达式

证明:设,从而为正定的H-阵(参考正定二次型中的性质),则存在唯一正定的H-阵,使得,于是,即,根据酉矩阵的定义,为酉矩阵,记,则,那么,其中,并且.

极分解定理不满秩时):设,则存在酉矩阵半正定H-阵使得,并且满足.

证明:根据奇异值分解定理,存在酉矩阵,使得,其中个奇异值,对式子作变形,,如果令,则.

5. 谱分解(正规矩阵)

正规矩阵的谱分解:设为正规矩阵,根据正规矩阵的结构定理,存在,使得,将按列分块得,其中的特征值所对应的单位特征向量,我们称上式为矩阵谱分解表达式

设正规矩阵个互异的特征值,特征值的重数为所对应的个两两正交的单位特征向量为,则的谱分解不等式又可以写成,其中,并且显然有).

定理:设阶矩阵,它有个互异的特征值,若的代数重数为,那么为正规矩阵的充要条件是存在阶矩阵,同时满足:

其中为从的正交投影矩阵。

例1:求正规矩阵的谱分解

解:先求出的特征值和特征向量,,故特征值为,当时对应的三个线性无关的特征向量为,当时对应的特征向量为,然后将正交化、单位化得,将单位化得,于是对应的对应的,于是的分解式为.

例2:求正规矩阵的谱分解表达式

解:,故特征值为,对应的特征向量分别为,因为正规矩阵属于不同特征值的特征向量彼此正交,直接单位化即可,.

(注意,即使特征值是0,那一项也必须写上)

6. 谱分解(可对角化矩阵)

可对角化矩阵的谱分解:设是一个阶可对角化矩阵,特征值为,与其相对应的特征向量分别为,如果记,那么。如果对应的个特征向量为,令,则可以写成.

例:已知为一个可对角化的矩阵,求其谱分解表达式

解:,故特征值为,对应的特征向量为,从而,取,令,则.

五、范数、序列、级数

1. 向量范数

向量范数:设是实数域(或复数域)上的维线性空间,对于中的任意一个向量按照某一确定的法则对应着一个实数,这个实数称为的范数,记作,并且要求范数满足下列运算条件:

只要满足上面性质的都叫范数,常用的有1-范数)、2-范数,又称为欧氏范数)、-范数),其中,并且它们满足:

引理(Holder不等式):设,则,其中,并且.

引理(Minkowski不等式):设,则,其中实数.

以上引理最常用的都是的时候。

p-范数:一般地,设向量,对任意的数,称为向量的p-范数。

p-范数三角不等式性质的证明用到了Minkowski不等式。

关于-范数形式的证明:设,令,并且至少有一个因此至少,于是有,由于,则,根据夹逼定理,由此可知.

向量范数的等价性定理:设维线性空间上定义的两种向量范数,那么一定存在两个与无关的正数使得。因此有限维线性空间上的任意两个向量范数都是等价的,利用向量范数可以去构造新的范数.

比如:设上的向量范数,且,则由,所定义的也是上的范数(可以自行验证其满足范数的三条性质)。

2. 矩阵范数

Ⅰ. 定义及常用矩阵范数

矩阵范数:对于任意一个矩阵,用表示按照某一法则确定与矩阵相对应的一个实数,并且要满足下列运算:

那么我们称是矩阵的范数。

比如,对于,定义,可以证明是矩阵的范数,前面3条性质容易验证,下面证明其满足第4条性质。设,则

再比如,对于,定义是矩阵范数,同样这里只给出性质4的证明。设,则

又比如,对于,定义,可以证明也是矩阵的范数,我们称此范数为Frobenious范数,同样这里只给出性质4的证明。设,则

Frobenious范数的性质

性质2的证明:比如是实矩阵,那么,于是对角线上元素的和就是(并且)。

酉不变性的证明:设里面的元素平方和是一样的,显然F-范数也相等;而,根据性质1,;而,根据前面证明可知,也相等。

矩阵的谱半径:设个特征值为,称为矩阵的谱半径。(即谱半径为特征值模长的最大值)(谱半径的另一种求法参考下一节中的Gelfand定理)

定理:阶复矩阵的谱半径不大于其任何一种范数:设,那么

证明:),,故.

特别地,若是一个阶正规矩阵,则.

证明:设的特征值为,由于是正规矩阵,所以存在酉矩阵使得,从而,所以.

其中,表示的特征值,的定义在后面。

矩阵范数的一些结论(设上的矩阵范数:

证明:根据特征值的性质,的特征值,由于矩阵的谱半径不大于其任何一种范数,,并且,即,得证、

矩阵范数的等价性定理:设是矩阵的任意两种范数,则总存在正数使得.

矩阵范数与向量范数的相容:设是向量范数,是矩阵范数,如果对于任何矩阵与向量,都有,则称矩阵范数与向量范数是相容的。

例:矩阵的Frobenious范数与向量的2-范数是相容的

证:是一个列向量,也可以看成是的矩阵,根据定义,.

Ⅱ. 通过向量范数构造与之相容的矩阵范数

通过已知的范数构造的范数叫诱导范数,下面通过例题说明

例:设是向量的范数,则满足矩阵范数的定义,且是与相容的矩阵范数

证:容易验证满足矩阵范数的非负性、齐次性、三角不等式,现在验证矩阵范数的相容性:

然后验证是相容的:

的定义可知,当时,,故,当时,.

由上面例题所定义的矩阵范数称为由向量范数所诱导的诱导范数(或算子范数),由向量p-范数所诱导的矩阵范数称为矩阵p-范数,即,常用的矩阵p-范数有.

常用的矩阵p-范数的形式(设):

比如,所以.

它们之间的关系:

第3点的证明:.

第4点的证明:.

(其中,表示的特征值)

Ⅲ. 通过矩阵范数构造与之相容的向量范数

定理:设是矩阵范数,则存在向量范数使得.

证明:对于任意的非零向量,定义向量范数,容易验证它满足向量范数的三个性质,且.

例:已知矩阵范数,求与之相容的一个向量范数

解:取,设,那么.

3. 矩阵序列与极限

矩阵序列及其收敛、极限:设矩阵序列(右上角表示序列的第个),其中,如果个数列都收敛,则称矩阵序列收敛。进一步,如果,那么,那么称矩阵矩阵序列的极限

矩阵序列的收敛定理:矩阵序列收敛于的充要条件是,其中为任意一种范数。

矩阵序列的极限的运算性质:

例:证明对于幂序列,若,则

证:,再由于范数.

幂序列收敛于零的充要条件:对于幂序列的充要条件是.

证明:设的Jordan标准型为,其中表示某特征值对应的Jordan块,由于是一个分块对角阵,,显然,而,其中,于是的充要条件是,因此的充要条件是.

Gelfand定理:设的相容矩阵范数,则对任意,都有.

证明:谱半径不大于其任何一种范数,于是,另一方面,对任给的,可以构造矩阵,这时,由前面定理知,,于是当时,有,那么存在正整数,使得当时,有,即,得证。

4. 矩阵级数

矩阵级数的收敛:设,如果个常数项级数都收敛,那么称矩阵级数收敛。特别地,如果都绝对收敛,那么称矩阵级数绝对收敛

矩阵级数的绝对收敛:设,矩阵级数绝对收敛的充要条件是正项级数收敛,其中为任意一种矩阵范数。

证明:先证明对其中一种矩阵范数成立,再利用矩阵范数的等价性推广到其他范数

充分性:取,那么对每一对都有,因此如果收敛,则对每一对,常数项级数都收敛。

必要性:若绝对收敛,则对每一对都有,于是,由此可知部分和数列有上界,根据正项级数收敛的条件知其收敛。

定理:对于两个绝对收敛的矩阵级数,它们的Cauchy积所组成的矩阵级数仍然绝对收敛。

即,设,且,令,则.

矩阵幂级数:设,形如的矩阵级数称为矩阵幂级数。

矩阵幂级数的绝对收敛:如果矩阵的某个范数在幂级数的收敛域内,那么矩阵幂级数绝对收敛。

证明:,其中是一个实数,可以看作是,那么如果的收敛半径内,则对应的矩阵幂级数也绝对收敛。

Cauchy-Hadamard定理:幂级数,当时绝对收敛,当时发散,当时收敛性要另行判断,这里为此幂级数的收敛半径,。(复数域的幂级数可以通过这个方法求收敛半径)

将Cauchy-Hadamard定理推广到矩阵:设幂级数的收敛半径为阶方阵,若,则矩阵幂级数绝对收敛,若,则发散,而时需另行判断。

证明:设的Jordan标准型为,其中对应的阶Jordan块,于是,所以,其中(其中是组合数),收敛就是里面每个元素对应的级数都收敛,因此只要判断每个Jordan块对应的级数是否收敛即可,根据定理的条件知,当时,幂级数收敛,而可以通过它求导得到(只是相差了系数),这是每个Jordan块都是绝对收敛的,因此当时,也是绝对收敛的。(发散同理可证)

和初等函数的Taylor展开式类似,矩阵幂级数:

.

.

.

.

.

.

.

定理:矩阵幂级数绝对收敛的充要条件是,且其和为.

例:已知,求证矩阵幂级数收敛,并求其收敛和

解:先求出其谱半径,,故特征值为,而级数的收敛半径是,因为,所以矩阵幂级数是收敛的。

由于,两边同时求导得,两边再次求导得,因此.

六、矩阵函数

1. 矩阵多项式

矩阵多项式:设和关于变量的多项式,那么称的矩阵多项式。

当次数很高时,可以用的Jordan标准型来计算,,这个式子称为的Jordan表示,其中,其中是组合数,于是.

定理:设个特征值为,那么矩阵多项式的特征值为.

例:已知多项式与矩阵,求

解:,于是.

2. 最小多项式

化零多项式:设和变量的多项式,如果满足,那么称为矩阵的一个化零多项式。

推论:若的化零多项式,是任一多项式,那么也是的化零多项式。

Hamilton-Cayley定理:已知为其特征多项式,则.

比如:,则特征多项式为,显然

并且容易看出也可以使,也就是说还存在比特征多项式次数更低的多项式可以使.

最小多项式:已知,在的化零多项式中,次数最低且首项系数为1的化零多项式称为的最小多项式,通常记为.

最小多项式的性质:

例:求Jordan块的最小多项式

解;的特征多项式为,那么它的最小多项式的形式一定为,其中,但是当时,,因此

定理:设分块对角阵分别为子块的最小多项式,则的最小多项式为其子块的最小多项式的最小公倍式.

定理:设矩阵的Jordan标准型为,其中的阶数是,那么的最小多项式为的最小公倍式。

比如:,这是一个有3个分块的Jordan标准型,它的最小多项式为.

3. 矩阵函数

定义:设个互异的特征值,的最小多项式为,其中,且,如果函数具有足够高阶的导数,并且个值存在,则称函数在矩阵的影谱上有定义

比如:,矩阵的最小多项式为,对于,代入后值存在(),对于,代入后值存在(),所以的影谱上有定义。

如果某个矩阵的最小多项式为,那么显然不存在,所以的影谱上没有定义。

矩阵函数:设矩阵,其最小多项式为,函数在矩阵的影谱上有定义,如果存在多项式满足,则定义矩阵函数.

注1:满足上述定义的多项式存在且不唯一。

注2:矩阵函数是与相同阶数的矩阵。

定理:设为两个不同的多项式,阶矩阵,则相等的充要条件是的影谱上的值对应相等,即.

,如果有定义,那么也有定义,且.(因为相似,它们有相同的最小多项式,因此的影谱上都有定义)

矩阵函数的Jordan表示:和矩阵多项式一样,矩阵函数也可以写成,其中

定理:设个特征值为,那么矩阵函数的特征值为.

例:设,求的Jordan表示并计算

解:首先算出的Jordan标准型,,从而的Jordan表示为,当时,,代入即可。(同理)

矩阵函数多项式表示:设矩阵,其最小多项式为,其中是矩阵个互异的特征值,且,且,根据Lagrange-Sylvester内插多项式定理知,有一个次数为的多项式,满足,因此的系数可以通过上面的关系式确定出来,我们称为矩阵函数的多项式表示。

例:设,求的多项式表示,并计算

解:的Jordan标准型为,因此最小多项式,从而存在一个次数为1的多项式,并且满足,即,解出,于是的多项式表示为,当时,,代入得

矩阵的幂级数表示:设,一元函数能够展成关于的幂级数,并且其收敛半径为,那么当的谱半径时,矩阵幂级数绝对收敛,并且.

例:设,求矩阵幂级数的和

解:算出的Jordan标准型,所以,再计算常数项幂级数的和,收敛半径.(其中次方指先求逆再平方)

4. 矩阵指数函数与矩阵三角函数

.

.

.

定理:设,那么当时,有

注:是充分不必要条件,比如:如果不能交换,则之间可能相等,也可能不相等。

推论:

几个特殊的性质:

七、函数矩阵、矩阵微分方程

1. 函数矩阵

函数矩阵:以未定元的函数为元素的矩阵,其中都是定义在闭区间上的多项式。

函数矩阵的加、乘、数乘、转置和数字矩阵一致。如果,则称在区间上是可逆的,称的逆矩阵,记作

比如在区间上是可逆的,其逆为.

可逆阶矩阵在区间上可逆的充要条件是上处处不为零,并且,其中的伴随矩阵。

:区间上的函数矩阵不恒等于零的子式的最高阶数称为的秩。

注意:对于阶函数矩阵而言,满秩与可逆不是等价的:可逆一定满秩,但满秩不一定可逆。

比如,它的秩是2,但是如果选取的区间包含零点,它就不可逆。

极限:如果的所有各元素处有极限,即,其中为固定常数,则称处有极限,记为,其中.

极限的运算性质(设):

连续:如果的各元素处连续,即,则称处连续,记为.

可导:如果的所有各元素在点处(或区间上)可导,则称此函数矩阵在点处(或区间上)可导,记作.

导数的运算性质:

可积:如果函数矩阵的所有各元素在上可积,则称上可积,且.

积分的运算性质:

函数向量的线性相关性:设有定义在区间上的个连续的函数向量,如果存在一组不全为零的常实数使得对所有都有,我们称线性相关。(如果只有当时等式才成立,那么就说线性无关)

Gram矩阵:设个定义在区间上的连续函数向量,),记),以为元素的常数矩阵称为的Gram矩阵,称为Gram行列式。

函数向量线性无关的充要条件:定义在区间上的连续多项式向量线性无关的充要条件是它的Gram矩阵为满秩矩阵。

例:,问线性相关性

解:,故当时,上是线性无关的。

Wronski矩阵:设)是个定义在区间上的有阶导数的函数向量,记,那么矩阵

是一个阶的矩阵,我们把称为的Wronski矩阵。

函数向量线性无关的充分不必要条件:设的Wronski矩阵,如果在区间上的某个点,常数矩阵的秩等于,则向量上线性无关。

例:设,问线性相关性

解:,因为的秩为2,所以是线性无关的。

2. 矩阵微分方程

形如的线性微分方程组可以表示成如下形式:,其中,它们的初始条件可以表示成

齐次微分方程组的解:设是一个阶常数矩阵,则微分方程满足初始条件的解为.

非齐次微分方程组的解:设是一个阶常数矩阵,则微分方程满足初始条件的解为.

证明:,两边同时积分得,整理得.

非齐次微分方程组的解2:设都是阶常数矩阵,是一个连续的多项式向量,那么线性非齐次初值问题的解可以由如下公式给出:.(Variation of Parameter Formula)

渐进稳定:设是一个阶常数矩阵,如果对任意的,初值问题的解满足条件,那么称微分方程组的解是渐进稳定的。

渐进稳定的充要条件:对任意的,初值问题的解渐进稳定的充要条件是矩阵的特征值都有负实部。

例1:设,求微分方程组满足初始条件的解

解:首先算出矩阵函数,由前面定理知,解为.

例2:设,求微分方程组满足初始条件的解

解:由前面定理知,解为,其中,前面例1已经算出,而,所以,所以.

八、矩阵的广义逆

1. 广义逆

定理:设是数域上的一个矩阵,则矩阵方程总是有解,如果,并且存在可逆矩阵使得,则前述矩阵方程的通解为,其中分别为任意矩阵。

证明:把解代入方程得,并且因此可以任取。

另一方面,任取方程的一个解,由于,即,因为可逆,于是,设,代入得,即,由此得出,从而.

广义逆:设是一个矩阵,矩阵方程的通解称为的广义逆矩阵,简称的广义逆,记作.(广义逆一般有无穷多个)

特别地,如果可逆,那么也是的解,并且此时是唯一的。

例:已知,求

解:由于广义逆要用到化为Simth标准型的行、列变换矩阵,所以要对作初等变换,得到,注意这里的和定理中的不一样,这里是,此时广义逆,其中,其取值任意。

广义逆的另一种表达式:任给,有奇异值分解,则方程变为,所以通解为,其中任取。

广义逆的性质

性质1的证明:.

性质2的证明:.

性质6的证明:的广义逆是方程的解,由于可逆,,把看作一个整体,则的广义逆,即,这时.

左逆:设,若存在矩阵,使得,则称的左逆。

右逆:设,若存在矩阵,使得,则称的右逆。

注:若有左逆,则列满秩;若有右逆,则行满秩。(反过来也成立)

如果并且满秩,则

左、右逆(如果存在)其实就是的广义逆

推论(设):

充分性显然,下面证必要性:由于,而的,这就意味着是可逆的,因此.(定理2的证明同理)

命题,有两个特殊的左、右逆:

自反广义逆:设,使成立的称为的自反广义逆,记作.

自反广义逆的充要条件:设的广义逆,则的自反广义逆的充要条件是.

自反广义逆的求法(1):设都是的广义逆矩阵,则的自反广义逆矩阵。

证明:.

自反广义逆的求法(2):如果有奇异值分解,其中为酉矩阵,则的自反广义逆的一般解为,其中为任意矩阵。

2. 伪逆矩阵

伪逆矩阵:设,若,且同时满足:

则称的伪逆矩阵。(上述条件称为Penrose-Moore方程

比如:设,其中是可逆矩阵,则.

定理:的伪逆矩阵唯一的。

证明:设都是的伪逆矩阵,则.

推论:若,则.

一般来说,,比如,则,而

伪逆矩阵的求法(1):设的一个满秩分解,则的伪逆矩阵.

伪逆矩阵的求法(2):如果有奇异值分解为酉矩阵,则的伪逆矩阵为.

例:设,求

解:利用满秩分解得,从而.

推论:

比如假设的满秩分解为,代入中即可得到。

伪逆矩阵的性质

前两条性质只需验证满足Penrose-Moore方程即可,下面证明第3条性质:.

例:设分别为阶与阶的酉矩阵,证明.

证:由于是酉矩阵可逆,所以,代入Penrose-Moore方程验证满足四个条件即可。

3. 广义逆与线性方程组

非齐次线性方程有解的充要条件:设,非齐次线性方程组有解的充要条件是存在的广义逆矩阵使得.

必要性:设有解且解为,那么,所以.

充分性:设,取,则.

注:如果存在的一个广义逆使得,那么对的任意一个广义逆,都满足.

证明:.

非齐次线性方程的解:设非齐次线性方程组有解,则它的解为,其中的任意一个广义逆。

矩阵方程有解的充要条件:设,则矩阵方程有解的充要条件是存在的广义逆,使得成立。

必要性:设方程有解,为一个解,则,任取的广义逆,满足.

充分性:设存在的广义逆,满足,显然是方程的一个解。

矩阵方程的解:设,在矩阵方程有解的情况下,方程的通解为,其中的任意给定广义逆,是任意矩阵。

证明:直接代入即可,.

证明:直接代入即可,.

另一方面,任取方程一解,则.

推论1:设,则矩阵方程有解的充要条件是存在的广义逆使得成立,此时矩阵方程的通解为,其中任意给定广义逆,是任意矩阵.(证明:令前面即可)

推论2:设,则非齐次线性方程组在有解的情况下,方程组的通解为,其中任意,是任意给定的的广义逆。

推论2解的形式类似”特解+齐次方程的解乘任意常数”的形式,其中的解(),而乘以是指让它的基础解系自由组合。

4. 最小二乘问题

线性最小二乘问题:设线性最小二乘问题包含求解下面集合:。显然该问题与非齐次线性方程组密切相关,当方程有解时,我们称方程是相容的,否则称它是不相容的。称相容方程组的所有解中模(2-范数)最小的解是最小模解。当无解时,如果满足对任意都有,则称是方程组的一个最小二乘解

范数最小值是0,但是当它取不到0时(找不到最小模解时),仍然可以找到一个最小值(对应的叫最小二乘解)。

定理:下面命题是等价的(设

定理:设,对于相容方程组,有如下结论:

最小模解的形式:对于相容线性方程组,它的最小模解是.

证明:当时解唯一,则一定是最小模解,只需证明的时候是最小模解即可。

方程的通解为,可以取定广义逆为伪逆,即通解通解表示成

(因为对于,对于)

由于可以任取,我们可以取,那么的最小值就是.

最小二乘解的讨论:对于不相容线性方程组,它的最小值为,此时对应的最小二乘解是相容方程组的解。

证明:

(其中,并且当时,,即最小值是零)

这样就把求解最小二乘解的问题转化为求解相容方程的解的问题。

定理:设,对于不相容方程组,有如下结论:

最小二乘解的形式是不相容线性方程组的唯一最佳最小二乘解。

证明:当时最小二乘解唯一,只需证明的时候是最佳最小二乘解即可。

,其中交叉项等于,自行证明。

例1:已知矩阵,求的最小二乘解及最佳最小二乘解,并求.

解:由于,所以无解,利用的满秩分解方法求得,故最小二乘解,其中的基础解系,即解为的特解+的通解的形式),最佳最小二乘解.

例2:已知一组数据

-2 1 3 5
-1 4 7 12

假设它们近似满足线性关系,求使得误差的平方和最小

解:设,要使误差最小,就是,即求的最小二乘解,因为列满秩,所以有唯一最小二乘解.

九、Kronecker积

1. Kronecker积

定义:设,则称由所确定的矩阵是Kronecker积,或直积.

比如:,则,而。Kronecker积一般不满足交换律,即一般情况下.

如果是列向量,则.

Kronecker积的运算性质

定理:设,则.

推论:若,则.

定理:设,则

从第3条可知,如果分别是阶、阶可逆矩阵,则也是可逆矩阵,且。它的证明比伪逆时的证明简单:.

定理:若,则.

证明:.

定理:设,则.

证明:设,则存在可逆矩阵,使得(其中为初等行变换矩阵,为初等列变换矩阵),所以.

定理:若,则.

证明:假设的Jordan标准型分别为,即,那么,也就是说相似于,它们行列式的值相等,设的特征值分别为,则(两个上三角矩阵的Kronecker积还是上三角矩阵,其行列式的值等于对角线上元素相乘;并且行列式的值等于特征值相乘)

2. Kronecker积的特征值

定理:设个线性无关的维列向量,个线性无关的维列向量,则维列向量)线性无关。反之,若维列向量线性无关,则均线性无关。

定理(特征值):设阶矩阵的特征值,阶矩阵的特征值,那么阶矩阵的特征值为(其中

考虑由变量组成的复系数多项式;若阶矩阵,阶矩阵,考虑由下式确定的矩阵.

比如:设,则

证明:设的Jordan标准型分别为,即,并且假设对角线上的元素分别为,那么,即,从而它们有相同的特征值,是上三角形矩阵,对角线元素为是特征值。

推论:设阶矩阵的特征值,阶矩阵的特征值,那么

定理(特征向量):设阶矩阵对应于特征值的线性无关的特征向量(),阶矩阵对应于特征值的线性无关的特征向量(),那么)是矩阵对应于特征值的线性无关的特征向量,其中.

证明:根据前面定理,均线性无关,那么)也线性无关;另外,根据特征向量的性质,有,那么

3. 矩阵的列展开与行展开

矩阵的行、列展开:将的各行依次横排得到一个维行向量,称为矩阵的行展开,记为,即。类似地,将的各列依次纵排得到维列向量,称为矩阵的列展开,记为,即.

根据定义,容易看出:

定理:设,则

证明:记,则,其中,它又可以改写成,故.

知,.

推论1:设,则.

推论2:设,则

证明:代入定理中的结论即可(的证明同理);,将第一点的两个结论加起来即可。

4. 线性矩阵代数方程

Ⅰ. 方程

问题:设),求解线性矩阵代数方程.

解:对此方程两边分别作列展开得,如果令,那么方程可以表示为,这样就把线性矩阵代数方程转化为线性方程。

定理是方程的解的充要条件是是方程的解。

推论1:方程有解的充要条件是.

推论2:方程有唯一解的充要条件是为非奇异.(非奇异:满秩,即无零特征根)

Ⅱ. 方程

定理:设,方程有唯一解的充要条件是的特征值满足),即没有相同的特征值。

证明:对应的线性方程为,这时方程要有解就要求系数矩阵非奇异,即没有零特征值,根据前面的定理知,的特征值是,得证。

其中表示的特征值。

推论:设,方程有非零解的充要条件是存在某个,使得.

证明:因为有唯一解的话就只有零解,要使它有非零解,就要让它的解不唯一,根据前面定理知,解不唯一就是要让.

Ⅲ. 方程

定理:设,方程有唯一解的充要条件是的特征值满足)。

证明:方程两边列展开化为线性方程,变成,有唯一解即系数矩阵非奇异,即的特征值,移项后得证。

例:已知,求矩阵方程的解

解:方程两边列展开后得到对应的线性方程组为,即,解得,由于的,将的列展开还原回去,得.