一、行列式
1. 行列式的形式
a11a21⋯an1a12a22⋯an2⋯⋯⋯⋯a1na2n⋯ann
一般来说,A表示一个矩阵,∣A∣表示相应的行列式.
2. 行列式的直接展开
全排列:把n个不同的数排成一列,叫做这n个数的全排列。如果数按从小到大的顺序1,2,⋯,n,那么叫n个数排列的标准次序。
逆序数:在n个数的排列中,当某两个数的先后次序与标准次序不同时,就说有一个逆序,一个排列中所有逆序总数叫做这个排列的逆序数。用τ(j1j2⋯jn)来表示j1⋯jn的逆序数。
大的数排在小的数前面叫逆序,比如4213的逆序数:
方法一:先看1,1前面有2个比它的大的数,2前面有1个,3前面有1个,4前面没有,所以4213的逆序数是2+1+1=4
方法二:数后面比它小的数,4后面有3个比它小的数,2后面有1个,1没有,3也没有,所以逆序数是3+1=4
像54321这种全部倒过来的排列,逆序数是(n−1)+(n−2)+⋯+2+1=2n(n−1).
排列中交换任意两个数的位置,逆序数的奇偶改变(交换一次位置,逆序数±1)
行列式的逆序数定义:
n阶行列式:a11a21⋯an1a12a22⋯an2⋯⋯⋯⋯a1na2n⋯ann=∑j1j2⋯jn(−1)τ(j1j2⋯jn)a1j1a2j2⋯anjn.
它是n!项的和,每一项是n个元素的乘积a1j1a2j2⋯anjn再乘以−1的列标构成的全排列(行标按顺序时)的逆序数次方,其中j1j2⋯jn是1,2,⋯,n的一个全排列(且各项的排列都不相同)
这里的定义是行取标准排列,列是任意全排列,也就是说,行按顺序取,列每次要取不同列(叫按行展开)。
比如先选第一行中的第一列a11,那么到第二行时,由于第一列已经被选过了不能选,可以选取第二列或其他列,比如选第三列a23,到第三行时,第一、三列都选过了不能选,可以选第二列或其他列…,以此类推。但是注意,每一项选择的次序都不能重复。
也可以换个选法,比如列按标准次序选,即按顺序选第1、2、3、…列,然后行随机来(叫按列展开)。但是一般来说,行和列至少要有一个是按顺序的,否则容易乱。
选完一项后,记得要乘以行标/列标的-1的逆序数次方。如果行和列都不按顺序选,那么就变成乘以-1的行标逆序数加列标逆序数次方。
特别的,二阶行列式:acbd=ad−bc。它的绝对值的几何意义是两向量组成的平行四边形的面积。
三阶行列式:
,它的绝对值的几何意义是三向量组成的平行六面体的体积。
二阶和三阶的行列式可以看成是用主对角线减辅对角线的方法展开,(但是4阶及以上的不行)
特别地,000bn00⋯∗0b2∗∗b1∗∗∗=(−1)τ(n(n−1)⋯21)b1b2⋯bn,其中τ(n(n−1)⋯21)=Cn2=2n(n−1).
3. 余子式和代数余子式
余子式:设∣A∣是一个n阶行列式,划去的第i行及第j列,剩下的(n−1)2个元素按照原来的顺序组成了一个n−1阶行列式,这个行列式称为∣A∣的第(i,j)元素的余子式,记为Mij.
代数余子式:Aij=(−1)i+jMij
定理(行列式的代数余子式展开):一个行列式的值D等于它的某一行(列),各元素与各自代数余子式乘积之和.
比如:D=a21A21+a22A22+⋯+a2nA2n.
4. 行列式的运算法则
(1)转置:转置后的值不变∣AT∣=∣A∣.(可以用“一个按行展开,一个按列展开”来理解)
(2)行列式数乘:用常数c乘以行列式,等于行列式的某一行(列)的各元素乘c;反过来说就是某一行(列)的公因数可以提到外面去.
对比矩阵数乘:∣cA∣=cn∣A∣,矩阵数乘是每个元素都乘以c.
(3)行列式相加:∣α,β1+β2,γ∣=∣α,β1,γ∣+∣α,β2,γ∣,两个行列式只有当除某一行(列)以外其余元素都相同的情况下才能相加,否则无法相加。
对比矩阵相加:A+B=(α1+α2,β1+β2,γ1+γ2),矩阵相加是对应位置的每个元素相加。
(4)行列式相乘:∣A∣∣B∣=∣AB∣,和矩阵乘法一致,但是只有同阶才能这样相乘,不同阶要先算出行列式的值后再相乘。
(5)行列式两行(列)互换,
值要变号.(因为逆序数奇偶性发生了改变)
(6)如果一个行列式某一行(列)的元素全为0,或者有两行(列)的元素成比例关系,则行列式的值为0.(互换两行值要变号,如果D=−D,那么D=0)
(7)行列式某一行(列)乘以一个数,加到另一行(列)
上去,行列式的值不变.(根据第2、3条性质,写成两行列式相加,由于构造的行列式某两行成比例,该行列式的值为0,0加原来的行列式所以不变)
(8)一行(列)的元素乘上另一行(列)的相应元素代数余子式之和为0.(用一行元素乘另一行元素的代数余子式,可以看作是另一行列式的代数余子式展开,还原回去,就变成一个两行相等的行列式,值为0.)
(9)拉普拉斯定理:在n阶行列式中任取k行(列),那么含于这k行(列)的所有k阶子式与它们所对应的代数余子式的乘积之和等于行列式的值。
(补充)k阶子式及其余子式、代数余子式:
设∣A∣是一个n阶行列式,取行列式∣A∣中第i1,i2,⋯,ik行以及第j1,j2,⋯,jk列交点上的元素,按原来∣A∣中的相对位置构成一个k阶行列式,则称这个行列式是∣A∣的一个k阶子式,记作A(i1j1i2j2⋯⋯ikjk)。
若划去∣A∣的第i1,i2,⋯,ik行以及第j1,j2,⋯,jk列后,剩下的元素按原来的相对位置构成一个n−k阶行列式,则称这个行列式是前述k阶子式的余子式,记作M(i1j1i2j2⋯⋯ikjk)。
若记p=i1+i2+⋯+ik、q=j1+j2+⋯+Jk,则A^(i1j1i2j2⋯⋯ikjk)=(−1)p+qM(i1j1i2j2⋯⋯ikjk)为前述k阶子式的代数余子式。
拉普拉斯定理是说,若取定k个行:∣A∣=1≤j1<j2<⋯<jk≤n∑A(i1j1i2j2⋯⋯ikjk)A^(i1j1i2j2⋯⋯ikjk),共Cnk项相加,取列同理。
特别地,当取的行和列都连续时,有A0∗B=A∗0B=∣A∣∣B∣.
(10)范德蒙行列式:
1a1⋯a1n−11a2⋯a2n−1⋯⋯⋯1an⋯ann−1=0<i<j<n∏Cn2个(aj−ai).
例:
行列式-行列式的性质-例-01
原本按拉普拉斯定理,应该每个子式都要乘以各自的代数余子式,不过取定了这些行后,只有上面这种列的取法不为零。
(11)反对称行列式(aij=−aji)如果是奇数阶的,值为0(但偶数阶不是)。比如:
D=0−a−ba0−cbc0=每行提一个-1(−1)30ab−a0c−b−c0=−DT=0
5. 克拉默法则
n元线性方程组⎩⎨⎧a11x1+a12x2+⋯+a1nxn=b1a21x1+a22x2+⋯+a2nxn=b2⋮an1x1+an2x2+⋯+annxn=bn
令其系数行列式为D,D=a11a21⋯an1a12a22⋯an2⋯⋯⋯⋯a1na2n⋯ann,Dj表示用b1b2⋮bn替换D的第j列,Dj=⋯⋯⋯⋯a1(j−1)a2(j−1)⋯an(j−1)b1b2⋯bna1(j+1)a2(j+1)⋯an(j+1)⋯⋯⋯⋯
对于非齐次方程,当D=0时,方程有唯一解,xj=DDj
对于齐次方程(即bi全部为0),当D=0时,只有零解(xj=0);当D=0时,有无穷多个非零解。(求解方法:(D∣β)→行(E∣η),η就是解)
6. 行列式的计算技巧
思路:
(1)用定义展开(当每一行/列只有一个元素时)
(2)化上(下)三角型,或三叉型
(3)利用代数余子式按行(列)展开,比如对角线上下都有元素,其余地方为0的,展开时尽量化成非零元素在顶角位置再展开
(4)拉普拉斯展开
(5)特殊行列式,如范德蒙行列式,比如提公因式变成范德蒙行列式的形式
① 行和(列和)相同的行列式
xaaaxaaa⋯a⋯⋯⋯aax
把第2、3、…列加到第一列上,再提取公因式,变成[x+(n−1)a]111axaaa⋯a⋯⋯⋯aax
第一列乘以−a加到第2、3、⋯列上,即可得到下三角型行列式[x+(n−1)a]1110(x−a)000⋯0⋯⋯⋯00(x−a)=[x+(n−1)a](x−a)n−1
② 加边法凑三叉型
一般是对角线上元素不同,其余地方有一定规律的(比如关于对角线对称),由于只需要一条边只有1个1其余是0,另一条边上写什么要看规律。
1+a11111+a2111⋯1⋯⋯⋯111+an(n)
利用代数余子式展开的性质,加一行一列100011+a111111+a2⋯11111⋯⋯⋯⋯1111+an(n+1)
第1行乘以−1,加到第2、3、…行上,得到三叉型行列式1−1−1−11a10010a20100⋱0⋯⋯⋯⋯100an(n+1)
第2列乘以a11,第3列乘以a21,….,加到第1列上,得到上三角型(1+a11+a21+⋯+an1)0001a10010a20100⋱0⋯⋯⋯⋯100an(n+1)
对于x1aaax2aaa⋯a⋯⋯⋯aaxn
也可以第2、3、…行都减去第一行x1a−x1a−x1ax2−a0a0⋯0⋯⋯⋯a0xn−a
就变成三叉型了。
对于dcc⋯cbxa⋯abax⋯a⋯⋯⋯⋯⋯baa⋯x,可以凑成上面的形式a2bcbca2daa⋯aaxa⋯aaax⋯a⋯⋯⋯⋯⋯aaa⋯x
例:
1+x12x2x1x3x1⋯xnx1x1x21+x22x3x2⋯xnx2x1x3x2x31+x32⋯xnx3⋯⋯⋯⋯⋯x1xnx2xnx3xn⋯1+xn2
加边升阶,得100000x11+x12x2x1x3x1⋯xnx1x2x1x21+x22x3x2⋯xnx2x3x1x3x2x31+x32⋯xnx3⋯⋯⋯⋯⋯⋯xnx1xnx2xnx3xn⋯1+xn2
第1行乘以−x1加到第2行上,第1行乘以−x2加到第3行上,…,得1−x1−x2−x3⋮−xnx1100⋮0x2010⋮0x3001⋮0⋯⋯⋯⋯⋱...xn000⋮1
第2列乘以x1加到第1列上,第3乘以x2加到第1列上,⋯,最后得Dn=1+∑i=1nxi2
③ 拆分成两个行列式相加
Dn=xcccbxccbbx⋯c⋯⋯⋯⋯bbbx=c+(x−c)cccbxccbbx⋯c⋯⋯⋯⋯bbbx=1111bxccbbx⋯c⋯⋯⋯⋯bbbx+(x−c)000bxccbbx⋯c⋯⋯⋯⋯bbbx
第一部分是行和相同的行列式,计算出值等于c(x−b)n−1;第二部分用代数余子式展开成(x−c)Dn−1。
即Dn=c(x−b)n−1+(x−c)Dn−1,如果将Dn转置,将a11变成b+(x−b),会得到Dn=b(x−c)n−1+(x−b)Dn−1,联立两式,消去Dn−1即可(要分b=c和b=c两种情况讨论)
例:
1+x12x2x1⋮xnx1x1x21+x22⋮xnx2⋯⋯⋱⋯x1xnx2xn⋮1+xn2=1+x12x2x1⋮xnx1x1x21+x22⋮xnx2⋯⋯⋱⋯00⋮1+1+x12x2x1⋮xnx1x1x21+x22⋮xnx2⋯⋯⋱⋯x1xnx2xn⋮xn2
=Dn−1+xn21+x12x2x1⋮x1x1x21+x22⋮x2⋯⋯⋱⋯x1x2⋮1=Dn−1+xn210⋮x101⋮x2⋯⋯⋱⋯00⋮1=Dn−1+xn2=1+x12+x22+⋯+xn2
④ 行列式的因式分解
Dn=a1−b1a2−b1an−b1a1−b2a2−b2an−b2⋯⋯⋯⋯a1−bna2−bnan−bn=a1a2an−1−1−100⋯0⋯⋯⋯000⋅1b1001b2001b300⋅⋯⋯⋯1bn00
当n≤2时,Dn=(a2−a1)(b2−b1);当n>2时,Dn=0.
例:设Sk=x1k+x2k+⋯+xnk,其中k为任意非负整数,求D=S0S1⋮Sn−1S1S2⋮Sn⋯⋯⋱⋯Sn−1Sn⋮S2n−2
解:D=1x−1⋮x1n−11x2⋮x2n−1⋯⋯⋱⋯1xn⋮xnn−1⋅11⋮1x1x2⋮xn⋯⋯⋱⋯x1n−1x2n−1⋮xnn−1=1≤i<j≤n∏(xj−xi)⋅1≤i<j≤n∏(xj−xi)=1≤i<j≤n∏(xj−xi)2
⑤ Hessenberg型行列式
Dn=x00⋮0an−1x0⋮0an−10−1x⋯0an−1⋯⋯⋱⋱⋯⋯000⋱xa2000⋯−1x+a1
按第1列展开:Dn=x⋅x0⋮0an−1−1x⋯0an−2⋯⋱⋱⋯⋯00⋱xa200⋯−1x+a1+an⋅(−1)n+1⋅(−1)n−1=x⋅Dn−1+an
=x⋅[x⋅Dn−2+an−1]+an=⋯=xn+a1xn−1+a2xn−2+a3xn−3+⋯+an−1x+an
⑥ 特征方程法
Dn=acbacba⋯b⋯⋯⋯⋯⋯⋯⋯acba
按第一列拉普拉斯展开,得:Dn=aDn−1−bcDn−2
解特征方程:x2=ax−bc,得x1=2a+a2−4bc,x2=2a−a2−4bc
即可得通式:Dn=x1−x2x1n+1−x2n+1
二、矩阵
1. 矩阵的加减、转置
(1)矩阵相加:A+B=(α1+α2,β1+β2,γ1+γ2),矩阵相加是对应位置的每个元素相加。
(2)矩阵数乘:∣cA∣=cn∣A∣,数c乘以矩阵A等于矩阵中每一个元素都乘以c.
矩阵相加和数乘满足:
(Ⅰ)A+B=B+A.
(Ⅱ)(A+B)+C=A+(B+C).
(Ⅲ)c(A+B)=cA+cB,(c+d)A=cA+dA.
(Ⅳ)c(dA)=(cd)A.
(Ⅴ)cA=0⇔c=0或A=0.
(3)转置:A的转置AT(或A′)
矩阵转置满足:
(Ⅰ)(AT)T=A.
(Ⅱ)(A±B)T=AT±BT.
(Ⅲ)(cA)T=c(AT).
(Ⅳ)(AB)T=BTAT.
(4)一些特殊的矩阵:
单位阵:E=100010001(有时也写成I)
对角矩阵:diag(a1,a2,a3,⋯)=∗000∗000∗.
数量阵:200020002=2E,若Λ=λE,则Λn⋅An=λEAn=λAn.
上(下)三角阵:∗00∗∗0∗∗∗.
对称矩阵:AT=A.
反对称矩阵:AT=−A.(由于aii=−aii,所以对角线上元素全为0)
2. 矩阵乘法
矩阵相乘得到的是一个新的矩阵,若A是m×n阶矩阵,B是n×s阶矩阵,那么AB是m×s阶矩阵。AB的(i,j)位元素是A的第i行与B的第j列对应元素乘积之和。(cij=ai1b1j+ai2b2j+⋯+ainbnj)
只有当A的列数等于B的行数时,AB才可以相乘。
矩阵乘法满足:
(1)线性性质
(A1+A2)B=A1B+A2B.
A(B1+B2)=AB1+AB2.
(cA)B=c(AB)=A(cB).
(2)结合律:(AB)C=A(BC).
(3)(AB)T=BTAT.
(4)矩阵的行列式:∣AB∣=∣A∣∣B∣.
(4)对于n阶方阵,Ak=k个相乘AA⋯A,AkAl=Ak+l,(Ak)l=Akl,A0=E.
(5)对于对角阵:a1000b1000c1a2000b2000c2=a1a2000b1b2000c1c2,即两个对角矩阵相乘只须把对角线上对应元素相乘,对角矩阵的k次方幂只须把每个对角线上元素作k次方幂。
矩阵乘法和数乘不同之处:
(1)无交换律,无消去律。
(2)左乘与右乘的结果不一定一样。
因此(AB)k=ABAB⋯AB=AkBk(除非AB=BA).
而(A+B)2=A2+AB+BA+B2,AB和BA不能合并成一项.
对于单位阵E,AE=EA=A,像A2−2A−3E可以因式分解成(A−3E)(A+E).
对于对角阵,Λ=λE,ΛA=λEA=A(λE)=λA
(2)AB=0是指A的行向量与B的列向量内积为0,即A的行向量与B的列向量垂直,因此不能得出A=0或B=0.(同理,即使A=0,AB=0,也不能得出B=0)
3. 矩阵的初等变换
三类初等行变换:
(1)换两行的上下位置.
(2)用非零常数c乘某一行.
(3)把一行的倍数加到另一行上(倍加变换).
阶梯形矩阵:形如∗000∗000∗∗00∗∗∗0∗∗∗∗,它满足:
(1)如果有零行,则都在最下面.
(2)各非零行的第一个非0元素的列号自上而下严格单调上升。或各行左边连续出现的0的个数自上而下严格单调上升,直到全为0。
台角:各非零行第一个非0元素所在位置。
行最简型矩阵:比如,1000∗000010000100001,它满足:
(1)台角位置的元素都为1.
(2)台角正上方的元素都为0.(即首非零元所在列除该首非零元外其余位置全为0)
每个矩阵都可用初等行变换化为阶梯形矩阵和简单阶梯形矩阵。
4. 矩阵的逆
定义:设A是n阶矩阵,如果存在n阶矩阵H,使得AH=E,且HA=E,则称A是可逆矩阵,称H是A的逆矩阵,记作A−1.
逆是唯一的,因此H和A互为逆,即A−1=H,H−1=A
比如要证明B是A的逆矩阵,一般用AB=E来证。
若A可逆,则A有消去律。左消去律:AB=AC⇒B=C;右消去律:BA=CA⇒B=C.
可逆的充要条件:A可逆⇔∣A∣=0
左边正右边(⇒):若AA−1=E,则∣A∣∣A−1∣=∣E∣=1,对于∣A−1∣是行列式,它是一个数,∣A−1∣=∣A∣1,此时要求A=0
右边正左边(⇐):要找H,它既是Ax=E的解,又是xA=E的解,当∣A∣=0,方程Ax=E有唯一解记作B,方程xA=E也有唯一解记作C,则AB=E,CA=E,B=(CA)B=C(AB)=C,故B=C=A−1。
逆的性质
(1)当A可逆时,AT也可逆,且(AT)−1=(A−1)T.
(2)当A可逆时,Ak也可逆,且(Ak)−1=(A−1)k.
(3)当A可逆时,若数c=0,则(cA)−1=c1A−1,(cA)(c1A−1)=(c⋅c1)AA−1=E.
(4)若A、B都是n阶可逆矩阵,则AB也可逆,且(AB)−1=B−1A−1.
(5)当A可逆时,∣A−1∣=∣A∣−1=∣A∣1.
逆的求法
(1)初等变换法:对A作增广(A∣E),然后通过初等行变换,变成(E∣A−1)
(2)伴随矩阵法:A−1=∣A∣A∗.
伴随矩阵:每个n阶矩阵A都有伴随矩阵,记作A∗,A∗=A11A12⋯A1nA21A22⋯A2n⋯⋯⋯⋯An1An2⋯Ann=(Aij)T,即A中每个元素用它的代数余子式替换后再转置,就是A∗.
伴随矩阵的性质:
(1)AA∗=A∗A=∣A∣E.
证明:AA∗=a11a21⋯an1a12a22⋯an2⋯⋯⋯⋯a1na2n⋯annA11A12⋯A1nA21A22⋯A2n⋯⋯⋯⋯An1An2⋯Ann=∣A∣0000∣A∣0000∣A∣0000∣A∣=∣A∣E
若A可逆,则∣A∣AA∗=E,即A−1=∣A∣A∗,或变形成A∗=∣A∣A−1.
(2)∣A∗∣=∣A∣n−1.
证明:AA∗=∣A∣E,若两边同时取行列式,∣AA∗∣=∣∣A∣E∣,左右分别化简得∣A∣∣A∗∣=∣A∣nE,即∣A∗∣=∣A∣n−1
(3)(A∗)−1=(A−1)∗.
证明:∣A∣AA∗=E,即(A∗)−1=∣A∣A,而(A−1)∗=∣A−1∣(A−1)−1=∣A∣A,故(A∗)−1=(A−1)∗.
(4)(AT)∗=(A∗)T.
(5)(Ak)∗=(A∗)k.
(6)(cA)∗=cn−1A∗.
(7)(AB)∗=B∗A∗.
(8)(A∗)∗=∣A∣n−2A.
证明:(A∗)−1=∣A∣A,∣A∗∣=∣A∣n−1,∴(A∗)∗=∣A∗∣(A∗)−1=An−2A.
目前已知的符号,T、k、−1、∗,任何两个的次序可以互换,比如(AT)∗=(A∗)T,(A∗)−1=(A−1)∗,(Ak)−1=(A−1)k.
对于AB,(AB)T=BTAT,(AB)−1=B−1A−1,(AB)∗=A∗B∗,但是(AB)k不一定等于BkAk.
5. 矩阵分块
一般法则:在计算两个矩阵A和B的乘积时,可以先把A和B用纵横线分割成若干小矩阵来进行,要求A的纵向分割与B的横向分割一致。
矩阵-矩阵分块-01
分块矩阵求转置:把子块视作元素整个矩阵做转置,并对每个子块自身作转置。
分块矩阵求逆:分块对角阵A110⋱0Ann−1=A11−10⋱0Ann−1,前提是A11⋯Ann都可逆.
更一般的求法:
设∣H∣=A0CB=∣A∣∣B∣=0可逆,求H−1
解:假设H−1=(X1X4X3X2),则HH−1=(A0CB)(X1X4X3X2)=(AX1+CX4BX4AX3+CX4BX2)=(E00E)
⎩⎨⎧AX1+CX4=EAX3+CX4=0BX4=0BX2=E,解得X2=B−1、X4=0、X1=A−1、X3=−A−1CB−1
即H−1=(A−10−A−1CB−1B−1).
两种常用的情况:
(1)A、B都分成4块
A=(A11A21A12A22),B=(B11B21B12B22),其中Ai1的列数和Bij的行数相等,Ai2的列数和B2j的行数相等。
此时AB=(A11B11+A12B21A21B11+A22B21A11B12+A12B22A21B12+A22B22)
(2)准对角阵
A11000A220⋯⋯⋱⋯00AkkB11000B220⋯⋯⋱⋯00Bkk=A11B11000A22B220⋯⋯⋱⋯00AkkBkk
矩阵的迹
对一个n阶矩阵A,规定tr(A)为A的对角线上元素之和,称为A的迹数。
于是(αβT)k=(βTα)k−1αβT=[tr(αβT)]k−1αβT
6. 矩阵的应用
Ⅰ. 方程组的矩阵表示
对于⎩⎨⎧a11x1+a12x2+⋯+a1nxn=b1a21x1+a22x2+⋯+a2nxn=b2⋯an1x1+an2x2+⋯+annxn=bn
若令A=a11a21an1a12a22an2⋯⋯⋯⋯a1na2nann,x=x1x2⋮xn,β=b1b2⋮bn,则上述方程可以写成Ax=β的形式
如果令α1=(a11,a21,⋯,an1)T,α2=⋯,则A=(α1,α2,⋯,αn),方程还可以写成x1α1+x2α2+⋯+xnαn=β
Ⅱ. 用初等行变换解线性方程组
用同解变换化简方程再求解 三种同解变换: ①交换两个方程的上下位置。
②用一个非零数c乘某一个方程。
③把某一方程的倍数加到另一个方程上去。
它在反映在增广矩阵上就是三种初等行变换。
矩阵消元法: ①写出增广矩阵(A∣β),用初等行变换化把(A∣β)化为阶梯形矩阵(B∣γ)。 ②用(B∣γ)判别解的情况。
- 如果(B∣γ)最下面的非零行为(0,⋯,0∣d),则无解,否则有解。
- 如果有解,记Γ是(B∣γ)的非零行数,则
- 唯一解求解的方法(初等变换法):去掉(B∣γ)的零行,得(B0∣γ0),它是n×(n+c)阶矩阵,B0是n阶梯形矩阵,从而是上三角矩阵。
B0=b110000∗b22000∗∗⋱00∗∗∗bn−1 n−10∗∗∗∗bnn,则bnn=0,bn−1 n−1=0,⋯bn都不为0. 于是把(B0∣γ0)化出的简单阶梯形矩阵应为B0=1000010000⋱00001c1c2⋯cn,其解为:⎩⎨⎧x1=c1x2=c2⋯xn=cn
Ⅲ. 矩阵乘法在初等变换中的作用
对单位矩阵作一次初等变换所得到的矩阵称为初等矩阵。
三种初等矩阵(对应矩阵三种初等变换,由于初等变换是可逆的,因此初等矩阵也是可逆的,其逆也是初等矩阵):
(1)E(i,j):交换E的第i,j两行(或i,j两列),比如:
E(2,3)=1000001001000001
交换两行的逆变换就是再交换一次,它的逆E−1(i,j)=E(i,j).
(2)E(i(c)):用数c(c=0)乘以E的第i行(或第i列),比如:
E(2(c))=10000c0000100001
数c乘一行的逆变换就是用c1乘以该行,它的逆E−1(i(c))=E(i(c1)).
(3)E(i,j(c)):把E的第j行的c倍加到第i行上(或把E的第i列的c倍加到第j列上,注意列的i,j是反过来的),比如:
E(1,3(c))=10000100c0100001
把E的第j行的c倍加到第i行上的逆变换就是,把第j行的−c倍加到第i行上,它的逆E−1(i,j(c))=E(i,j(−c)),且∣E(i,j(c))∣=1.
命题:初等矩阵从左(右)侧乘一个矩阵A等同于对A作一次相当的初等行(列)变换。
矩阵的初等变换都可以用左乘或右乘初等矩阵来表示。
比如:(α1,α2,α3,α4)E(1,3(c))=(α1,α2,α3,α4)10000100c0100001=(α1,α2,cα1+α3,α4)
三、向量组的线性关系和秩
1. 线性表示
β可以用α1,α2,⋯,αs线性表示(或者说β可以表示α1,α2,⋯,αs的线性组合),就是说存在c1,c2,⋯,cs,使得
c1α1+c2α2+⋯+csαs=0
记作β→α1,α2,⋯,αs.
β→α1,α2,⋯,αs⇔x1α1+x2α2+⋯+xsαs=β有解⇔(α1,α2,⋯,αs)x=β有解(x=(x1,⋯,xs)T)
Ax=β,即β可以用A的列向量线性表示。
对于多个的情况:β1,β2,⋯,βt→α1,α2,⋯,αs,意味着每个βi→α1,α2,⋯,αs.
写成方程的形式:AB=C,其中A=(α1,α2,⋯,αn),C=(r1,r2,⋯,rs),则r1,r2,⋯,rs→α1,α2,⋯,αn.
反过来说,就是:如果β1,β2,⋯,βt→α1,α2,⋯,αs,则存在C,使得(β1,β2,⋯,βt)=(α1,α2,⋯,αs)C.
例如:β1=α1+α2+α3,β2=2α2+α3,β3=2α2+3α3
则(β1,β2,β3)=(α1,α2,α3)111021023.
线性关系具有传递性:若β1,β2,⋯βt→α1,α2,⋯,αs→r1,r2,⋯,rn,则β1,β2,⋯βt→r1,r2,⋯,rn.
线性关系的等价:如果α1,α2,⋯,αs与β1,β2,⋯βt可以相互表示,则称它们等价,记作α1,α2,⋯,αs⇌β1,β2,⋯βt.
2. 线性相关
线性相关:若存在向量αi可以用其他向量α1,⋯,αi−1,αi+1,⋯,αs线性表示,则称α1,⋯,αi−1,αi,αi+1,⋯,αs是线性相关的。
线性无关:每个向量ai都不能用其他向量线性表示。
定义(用方程表示):若存在不全为0的常数c1,c2,⋯,cs,使得c1α1+c2α2+⋯+csαs=0,则称α1,α2,⋯,αs线性相关;否则称α1,α2,⋯,αs线性无关。
当α1,α2,⋯,αs线性相关还要使得方程成立,则c1,c2,⋯,cs必定全为0.
即,线性相关则(α1,α2,⋯,αs)x=0有非零解,线性无关则方程只有零解。
- 当s=1时,即,只有一个向量时,方程变为αx=0,可知,α相关⇔α=0.
- 当s=2时,α1,α2相关⇔对应分量成比例,α1=(a1,a2,⋯,an),α2=(b1,b2,⋯,bn),则a1:b1=a2:b2=⋯=an:bn.
例:判断(1,0,−1)、(−1,−1,2)、(2,3,−5)是否线性相关
解:设k1,k2,k3,使得k1(1,0,−1)+k2(−1,−1,2)+k3(2,3,−5)=0
即⎩⎨⎧k1−k2+2k3=0−k2+3k3=0−k1+2k2−5k3=0,解得{k1=k3k2=3k3,任取一组不全为零的k3=1,k1=1,k2=3都可以让方程成立
∴线性相关
线性相关的性质:
(1)向量个数s和向量维数n相同时(即写成矩阵方程的形式后,A是方阵),α1,⋯,αs线性相关,则∣A∣=0.(线性无关则∣A∣=0)
根据克拉默法则,Ax=0有非零解,则∣A∣=0。
(2)若向量个数s比如维数n大,则α1,⋯,αs一定线性相关。
逆否命题:如果α1,⋯,αs线性无关,则s≤n.
因为Ax=0方程的个数n<未知数个数s.
比如4个三维向量一定线性相关。
(3)如果α1,⋯,αs线性无关,则它的每一个部分组都线性无关。
逆否命题:如果α1,⋯,αs有相关的部分组,那么它自己一定也线性相关。
比如,若α1,α2,α3,α4,α5线性无关,则α2,α4,α5也线性无关。
(4)若α1,α2,⋯,αs是一个极大无关组,则α1,α2,⋯,αs,β一定线性相关。
逆否命题:如果α1,α2,⋯,αs线性无关,且β↛α1,α2,⋯,αs,则α1,α2,⋯,αs,β线性无关。
(4)当β→α1,α2,⋯,αs时,若表示方式唯一⇔α1,α2,⋯,αs线性无关。(表示方式不唯一,则线性相关)
(5)若β1,⋯,βt→α1,⋯,αs,并且t>s,则β1,⋯,βt一定线性相关。
逆否命题:若β1,⋯,βt→α1,⋯,αs,且β1,⋯,βt线性无关,则t≤s.
推论:若两个无关向量组α1,⋯,αs和β1,⋯,βt等价,则s=t.
证明:记A=(α1,⋯,αs),B=(β1,⋯,βt),若可以被线性表示,则存在s×t阶矩阵C,使得B=AC
Cx=0有s个方程,t个未知数,因此一定有非零解η,使得Cη=0
则Bη=ACη=0,即η也是Bx=0的非零解,从而β1,⋯,βt线性相关。
(6)若α1,α2,⋯,αs线性无关,则它们的接长向量也线性无关。
比如:⎩⎨⎧α1=(1,3,5)α2=(6,−1,8)α3=(−3,3,9)线性无关,则⎩⎨⎧γ1=(1,3,5,1,6)γ2=(6,−1,8,3,3)γ3=(−3,3,9,10,8)也线性无关
证明:设k1γ1+k2γ2+k3γ3=0,即⎩⎨⎧k1+6k2−3k3=03k1−k2+3k2=05k1+8k2+9k3=0k1+3k2+10k3=06k1+3k2+8k3=0
由于α1,α2,α3线性无关,只看前三个方程就只有零解了,那么这五条方程也都只有零解,即(γ1,γ2,γ3)线性无关。
3. 极大无关组和秩
极大无关组:α1,α2,⋯,αs的一个部分组I,若I满足①I线性无关②再扩大就相关,则称I为它的极大无关组。
秩:规定α1,α2,⋯,αs的秩等于I中向量的个数(r(α1,α2,⋯,αs)=#(I))。0≤r(α1,α2,⋯,αs)≤min(n,s).
一个线性无关的部分组I,若#(I)=r(α1,α2,⋯,αs),则I一定是极大无关组。
极大无关组的求法:首先明确一个概念:初等行变换不改变列之间的线性关系。因此可以把α1,α2,⋯,αs按列组成矩阵,通过初等行变换把矩阵变换成行最简型矩阵,然后看出原来的线性关系。
初等行变换不改变列之间的线性关系的证明:
举个具体的例子:100010530→r3=r1+r2101011538
此时530=5100+3010,且538=5101+3011.
例:1−22−12−480−24−233−60−6→行10000100−321006−2300
把右边的每一列分别记作β1,β2,β3,β4,左边每一列记作α1,α2,α3,α4,则
从右边可以看出,β3=−3β1+21β2,β4=6β1−23β2
由于变换后列之间的线性关系没有改变,因此左边列之间的关系为,α3=−3α1+21α2,α4=6α1−23α2
既然α3和α4可以用α1、α2线性表示(且表示方式唯一,即系数唯一),则α1、α2是一个极大无关组。
极大无关组的性质:
(1)α1,α2,⋯,αs线性无关⇔r(α1,α2,⋯,αs)=s.
(2)β→α1,α2,⋯,αs⇔r(α1,α2,⋯,αs,β)=r(α1,α2,⋯,αs)。此时α1,α2,⋯,αs是α1,α2,⋯,αs,β的极大无关组,也即,α1,α2,⋯,αs,β是线性相关的。
(3)β↛α1,α2,⋯,αs⇔r(α1,α2,⋯,αs,β)=r(α1,α2,⋯,αs)+1.
(4) r(α1,α2,⋯,αs,β)=r(α1,α2,⋯,αs)=s⇔β可以用α1,α2,⋯,αs唯一线性表示.
(5)β1,β2,⋯,βt→α1,α2,⋯,αs⇔r(α1,α2,⋯,αs,β1,β2,⋯,βt)=r(α1,α2,⋯,αs),且此时r(β1,β2,⋯,βt)≤r(α1,α2,⋯,αs).
(6)α1,α2,⋯,αs≅β1,β2,⋯,βt⇔r(α1,α2,⋯,αs)=r(α1,α2,⋯,αs,β1,β2,⋯,βt)=r(β1,β2,⋯,βt).
具有相同线性关系的向量组:两个向量组若有相同的向量个数:α1,α2,⋯,αs,β1,β2,⋯,βs,并且方程x1α1+x2α2+⋯+xsαs=0与x1β1+x2β2+⋯+xsβs=0同解,则称它们有相同的线性关系。它们有如下性质:
- 对应的部分组有一致的相关性。若α1,α2,α4对应的部分组为β1,β2,β4,若α1,α2,α4线性相关,则存在不全为零的c1,c2,c4使得c1α1+c2α2+c4α4=0,此时c1,c2,c4也会使得c1β1+c2β2+c4β4=0,因此β1,β2,β4也线性相关。
- 极大无关组相对应,从而秩相等。
- 有一致的内在线性表示关系。比如α3=3α1+2α2−α4,则β3=3β1+2β2−β4.
4. 矩阵的秩
定义:r(A)是A的非零子式的最高阶数。
定理:矩阵A的行向量组的秩等于列向量组的秩。r(A)=行(列)向量组的秩。
秩的求法:将(α1,α2,⋯,αs)通过初等变换变成阶梯型B,那么B的非零行数就是r(α1,α2,⋯,αs).(初等变换不改变矩阵的秩)
比如A=1−1240312307141−22021510→行10000100310000102100=C
A的行秩=C的行秩=C的列秩=A的列秩
矩阵的秩的性质:
(1)0≤r(Amn)≤min(m,n).
(2)r(A)=0⇔A=0.
(3)若Amn行满秩,r(A)=m;若Amn列满秩,r(A)=n.
(4)若Ann满秩,则以下几个命题等价
- r(A)=n.
- A的行(列)向量线性无关.
- ∣A∣=0.
- A可逆.
- Ax=0只有零解,Ax=β有唯一解.
矩阵在运算中秩的变化:
(1)r(AT)=r(A).
(2)c=0时,r(cA)=r(A).
(3)r(A±B)≤r(A)+r(B).
(4)r(AB)≤min{r(A),r(B)}.
(5)A可逆时,r(AB)=r(B)。B可逆时,r(AB)=r(A).
B=A−1(AB),r(B)≤min(r(A−1),r(AB))=r(AB)
(6)A列满秩时,r(AB)=r(B);B行满秩时,r(AB)=r(A).
(7)若AB=0,则r(A)+r(B)≤n(n是A的列数、B的行数)
证明:设Amn,Bns=(β1,⋯,βs)
若AB=0,则AB=A(β1,⋯,βs)=(Aβ1,⋯,Aβs)=(0,⋯,0)
即Aβi=0(i=1,2,⋯),也就是说βi是Ax=0的解
(1)当r(A)=n时,有唯一的零解,βi=0,r(A)≤n成立
(2)当r(A)<n时,有无穷多解,基础解系中有n−r(A)个解,r(B)=r(β1,⋯,βs)≤n−r(A),即r(A)+r(B)≤n.
向量组的线性关系和秩-矩阵的秩-01
(8)r(AB)+n≥r(A)+r(B).
证明:
向量组的线性关系和秩-矩阵的秩-02
四、线性方程组
1. 解的性质
对于Ax=0:如果η1,η2,⋯,ηs是一组解,则它们的任意线性组合c1η1+c2η2+⋯+csηs一定也是解。(∀i,Aηi=0⇒A(c1ηn+c2η2+⋯+csηs)=0)
对于Ax=β(β=0):如果ξ1,ξ2,⋯,ξs是Ax=β是Ax=β的一组解,则
- c1ξ1+c2ξ2+⋯+csξs也是Ax=β的解⇔c1+c2+⋯cs=1.
- c1ξ1+c2ξ2+⋯+csξs是Ax=0的解⇔c1+c2+⋯+cs=0.
- ∀i,Aξi=β,则A(c1ξ1+c2ξ2+⋯+csξs)=c1Aξ1+c2Aξ2+⋯+csAξs=(c1+c2+⋯+cs)β.
- 当ξ1,ξ2是Ax=β的两个解时,ξ1−ξ2是Ax=0的解.
- 如果ξ0是Ax=β的解,则n维向量ξ也是Ax=β的解⇔ξ−ξ0是Ax=0的解。
2. 解的情况判别
对于Ax=β,即x1α1+x2α2+c⋯+xnαn=β:
- 有解,则以下命题等价
- ⇔β→α1,α2,⋯,αn.
- ⇔r(α1,α2,⋯,αn,β)=r(α1,α2,⋯,αn).
- ⇔r(A∣β)=r(A).
- 无解⇔r(A∣β)>r(A).
- 唯一解⇔r(A∣β)=r(A)=n.
- 无穷多解,⇔r(A∣β)=r(A)<n.
若方程的个数为m,r(A∣β)≤m,r(A)≤m,此时:
- 当r(A)=m时,r(A∣β)=m,有解.
- 当m<n时,r(A)<n,不会是唯一解.
对于齐次线性方程组Ax=0:
- 只有零解⇔r(A)=n(即A满秩).
- 有非零解⇔r(A)<n.
推论1:如果A列满秩,则A有左消去律(①AB=0⇒B=0,②AB=AC⇒B=C)
①证:记B=(β1,β2,⋯,βs),则AB=(Aβ1,⋯,Aβs),AB=0,则∀i,Aβi=0,即βi是Ax=0的解。Ax=0只有零解,故βi=0.
②证:A(B−C)=0,B−C=0,代入①的结论得证。
推论2:如果A列满秩,则r(AB)=r(B)
证:可以改为证ABx=0与Bx=0同解。
设η是ABx=0的解,ABη=0,故Bη=0,即η是Bx=0的解。
3. 基础解系和通解
齐次线性方程(当Ax=0有非零解时)
记J是Ax=0的全部解的集合,称J的极大无关组为Ax=0的基础解系。
η1,η2,⋯,ηs是Ax=0的基础解系的条件:
(1)每个ηi都是Ax=0的解.
(2)η1,η2,⋯,ηs线性无关.
(3)Ax=0的每个解η→η1,η2,⋯,ηs.
此时,Ax=0的通解为c1η1+c2η2+⋯+csηs(ci为任意常数).
定理:r(J)=n−r(A).
基础解系的求法(齐次方程):
例:对于Ax=0
A=( )→行100010−49430−43−47041450
根据矩阵写出{x1=49x3+43x4−41x5x2=−43x3+47x4−45x5,因此x3、x4、x5是自由未知量
由于基础解系要求线性无关,利用线性无关向量的接长向量也线性无关的性质,令x3x4x5取100、010、001
故基础解系η1=49−43100、η2=4347010、η3=−41−45001.
此时x1x2x3x4x5=49x3+43x4−41x5−43x3+47x4−45x5x3+0x4+0x50x3+x4+0x50x3+0x4+x5=49x3−43x3x30x30x3+43x447x40x4x40x4+−41x5−45x50x50x5x5=x3η1+x4η2+x5η3.
观察可知,r(A)=3,而解中的极大无关组是η1、η2、η3,即r(J)=3,故r(J)+r(A)=n(n是未知数的数量),前面定理得证。
非齐次线性方程
对于Ax=β:如果ξ0是Ax=β(β=0)的一个解,η→η1,η2,⋯,ηs是Ax=0的基础解系,则Ax=β的通解为ξ0+c1η1+c2η2+⋯+csηs(ci为任意常数).
如果α1和α2都是Ax=β的解,那么α1−α2是Ax=0的解.
基础解系的求法(非齐次方程):
例:对于Ax=β,对A做增广,变成(A∣β),记作A
A=11315−28−9−11−13−1317−1317→行1000010073−7200713−7400713−7400.
根据矩阵写出{x1=713−73x3−713x4x2=−74+72x3+74x4,因此x3、x4是自由未知量
求特解:令(x3x4)=(00),代入得ξ0=713−7400是特解
求齐次时的通解:写出Ax=0,得到{x1=−73x3−713x4x2=72x3+74x4,令(x3x4)为(10)、(01),得η1=−737210、η2=−7137401.
故通解为ξ0+x3η1+x4η2.
五、特征向量与特征值、相似与对角化
1. 特征向量和特征值
设A是n阶矩阵,η是n维非零列向量,Aη与η是否相关?
定义:如果η=0,并且Aη与η线性相关,则称η是A的一个特征向量。此时,存在λ,使得Aη=λη,称λ为η的特征值。
设A是数量矩阵λE,则对每个n维列向量η,Aη=λη,于是,任何非零列向量都是λE的特征向量,特征值都是λ。
性质:
(1)特征值是有限的,特征向量无穷多.
若Aη=λη,则A(cη)=cAη=cλη=λ(cη).
若Aη1=λη1、Aη2=λη2,可得A(c1η1+c2η2)=c1Aη1+c2Aη2=λ(c1η1+c2η2).
(2)每个特征向量都有对应的一个特征值,而且不同的特征向量可以有相同的特征值。
计算(一般先求出特征值,然后再求特征向量):
对于n阶方阵,由于Aη=λη(η=0),故(λE−A)η=0,由于η=0,故对于方程(λE−A)x=0,要使∣λE−A∣=0才有非零解,且此时η是(λE−A)x=0的非零解。
称∣xE−A∣为A的特征多项式。
命题:
(1)λ是A的特征值⇔∣λE−A∣=0.
(2)λ是A的特征值⇔λ是A的特征多项式∣xE−A∣的根(λ的重数就是λ作为∣xE−A∣的根的重数).
(3)η是属于λ的特征向量⇔η是(λE−A)x=0的非零解.
(4)n阶矩阵A的特征值有n个,λ1,λ2⋯,λn,其中有的可能不是实数,有的可能是多重的。
计算步骤:
(1)写出特征多项式∣xE−A∣,并解出它的根,得到特征值。
(2)对每个特征值λi,求(λiE−A)x=0的非零解,得到属于λi的特征向量。
例:1−22−2−2424−2
解:∣λE−A∣=λ−12−22λ+2−4−2−4λ+2→r3=r3+r2λ−1202λ+2λ−2−2−4λ−2=(λ−2)(λ−2)(λ+7)
∴λ1=−7,λ2=λ3=2
对于λ1=−7,λ1E−A=−82−22−5−4−2−4−5→行⋯,得η1=c112−2(c1=0)
对于λ2=λ3=2,λ2E−A=12−224−4−2−44→行⋯,得c2−210+c3201(c2、c3不同时为0)
两种特殊的情形:
(1)A是上(下)三角矩阵,对角矩阵时,特征值即对角线上的元素。
A=λ100∗λ20∗∗λ3,∣xE−A∣=x−λ100−∗x−λ20−∗−∗x−λ3=(x−λ1)(x−λ2)(x−λ3).
(2)r(A)=1时,A的特征值为tr(A).
特征值的性质
命题:n阶矩阵A的特征值λ的重数≥n−r(λE−A).
命题:设A的特征值为λ1,λ2,⋯,λn,则
(1)λ1⋅λ2⋯λn=∣A∣.
(2)λ1+λ2+⋯+λn=tr(A),
证明: 若xa3x2+bx+c=0的根是k1,k2,k3,那么方程可以写成(x−k1)(x−k2)(x−k3)=0。同理,如果∣xE−A∣=0的解为λ1,λ2,⋯,λn,由于它展开后是关于x的n次方程,那么可以写成以下形式:
x−a11−a21−a31−a41−a12x−a22−a32−a42−a13−a23x−a33−a43−a14−a24−a34x−a44=(x−λ1)(x−λ2)(x−λ3)(x−λ4)
比较两边的常数项部分,得(1)的结论。(令x=0即可得到常数项,要注意∣−A∣=(−1)n∣A∣)
比较两边x3的系数,得(2)的结论。(右边根据莱布尼兹定理展开后得出系数为−(λ1+λ2+λ3+λ4),左边按行展开,会出现x3的项只有(x−a11)(x−a22)(x−a33)(x−a44)),其系数为−(a11+a22+a33+a44)=−tr(A).
与A相关的矩阵的特征向量与特征值
命题:设η是A的特征向量,对应的特征值为λ,即Aη=λη,则
(1)对于A的每个多项式f(A),f(A)η=f(x)η。
证:Aη=λη→kAη=kλη,即kλ是kA的特征根;AAη=λAη=λ2η,即λ2是A2的特征很;类似的,线性的证明同理。
例:(A5−4A3+2A2−E)η=(λ5−4λ3+2λ2−1)η.
(2)当A可逆时,A−1η=λ1η,A∗η=λ∣A∣η.
证:Aη=λη→η=λA−1η→A−1η=λ1η;∣A∣η=λA∗η→A∗η=λ∣A∣η.
命题:设A的特征值为λ1,λ2,⋯,λn,则
(1)f(A)的特征值为f(λ)1、f(λ2)、⋯、f(λn).
(2)A可逆时,A−1的特征值为λ11、λ12、⋯、λ1n,A∗的特征值为λ1∣A∣、λ2∣A∣、⋯、λn∣A∣.
(3)AT的特征值还是λ1、λ2、⋯、λn,但特征向量不一定相同。
证明:∣xE−AT∣=∣xET−AT∣=∣(xE−A)T∣=∣xE−A∣
(4)若λ1,⋯,λn不互相同,则每个λ对应的特征向量η1,⋯,ηs线性无关,并且无论一个λ对应多少个η,所有的η之间也线性无关。
(5)k重特征根对应的线性无关特征向量个数≤k个,对于单根,至少对应一个特征向量。
特征值的应用:
(1)求矩阵的行列式的值,∣A∣=λ1λ2⋯λn.
(2)判别可逆性.
- λ是A的特征值⇔∣λE−A∣=0⇔A−λE或A−λE不可逆.
- A−λE可逆⇔λ不是A的特征值.
- 当f(A)=0时,如果f(c)=0,则A−cE可逆.
- 若λ是A的特征值,则f(λ)是f(A)的特征值,⇒f(λ)=0.
- f(c)=0⇒c不是A的特征值⇔AcE可逆.
2. 矩阵的相似
设A、B是两个n阶矩阵,如果存在n阶可逆矩阵U,使得U−1AU=B,则称A与B相似,记作A∼B.
相似的性质
(1)对称性:U−1AU=B,则A=UBU−1.
(2)传递性:A∼B,B∼C,则A∼C.
证明:U−1AU=B,V−1BV=C,则(UV)−1A(UV)=V−1U−1AUV=V−1BV=C.
(3)特别地,若A相似于一个对角阵Λ,A=U−1ΛU,则Ak=U−1ΛkU(对角阵的k次方等于对角线上元素的k次方).
当A∼B时,A和B有许多相同的性质:
(1)∣A∣=∣B∣.
证明:∣B∣=∣U−1AU∣=∣U−1∣∣A∣∣U∣=∣A∣.
(2)r(A)=r(B).
(3)A、B的特征多项式相同,从而特征值完全一致。(从而行列式的值相同,矩阵的迹也相同)
证明:∣xE−B∣=∣xE−U−1AU∣=∣xU−1EU−U−1AU∣=∣U−1(xE−A)U∣=∣xE−A∣.
(4)A与B特征向量的关系:η是A的属于λ的特征向量⇔U−1η是B的属于λ的特征向量。
证明:Aη=λη⇒U−1Aη=λU−1η⇒U−1AUU−1η=λU−1η.
3. 矩阵的对角化
不是所有矩阵都可以对角化的,比如A=(1011),若U−1AU=(λ100λ2),则λ1=λ2=1,则A=E,显然这时错误的。
若A相似于一个对角矩阵,设可逆矩阵U=(η1,η2,⋯,ηn),则U−1AU=λ10000λ20000⋱0000λn,于是A(η1,η2,⋯.ηn)=(η1,η2,⋯.ηn)λ10000λ20000⋱0000λn=(λ1η1,λ2η2,⋯,λnηn),可见Aηi=λiηi,因此ηi就是A的特征向量,即U是由A的特征向量ηi按列构成的矩阵,对角矩阵中对角线元素上是U中对应列中ηi对应的特征值λi。
基本定理:A可对角化⇔A有n个线性无关的特征向量。
判别法则:A可对角化⇔对于A的每个特征值λ,λ的重数=n−r(λE−A)。当λi是一重特征值时,重数1=n−r(λE−1)一定成立,只需对重数>1的特征值检查。
推论:如果A有n个不同的特征值,则A一定可对角化。
例:A=3−232−26−12−1,若A相似于一个对角矩阵Λ,求U和Λ.
解:∣λE−A∣=λ−32−3−2λ+2−61−2λ+1=λ−20λ−2−2λ+2−61−2λ+1=(λ−2)2(λ+4)=0,
对于λ1=−4,(λ1E−A)=0,−72−3−2−2−61−2−3→行100010−31320,{x1=31x3x2=−32x3,x3是自由量,令x3=1,则η1=31−321.
同理,对于λ2=λ3=2,解得η2=012,η3=101.
∴U=31−321012101,Λ=−400020002.
六、实二次型
1. 二次型、合同矩阵
二次型是多个变量的二次齐次多项式函数。如f(x,x2,⋯,x3)=3x12−2x22+x32+4x1x2−6x1x3+5x2x3是一个三元二次型,它的每一项都是二次:或是一个变量的平方,称为平方项;或是两个不同变量的乘积,称为交叉项。
一个n元二次型的一般形式为f(x1,x2,⋯,xn)=∑i=1naiixi2+2∑i<jaijxixj.
只有平方项的二次型称为标准二次型。(包括(xi−xj)2形式的平方项)
形如:x12+x22+⋯+xp2−xp+12−⋯−xp+q2的n元二次型称为规范二次型。(只有xi的平方项,且系数按1、−1、0的顺序排列)
二次型可以写成矩阵的形式:对每个n阶实矩阵A,记X=(x1,x2,⋯,xn)T,则XTAX是一个二次型。
例如n=3时,A=a11a21a31a12a22a32a13a23a33,
则XTAX=(x1,x2,x3)a11a21a31a12a22a32a13a23a33x1x2x3=(x1,x2,x3)a11x1+a12x2+a13x3a21x1+a22x2+a23x3a31x1+a32x2+a33x3=∑i,j=13aijxixj
其中平方项的系数都是A的对角线上元素,而交叉项xixj的系数是aij+aji.
由于一个二次型写成矩阵形式时,交叉项的系数满足aij+aji即可(对角线上元素是平方项的系数是唯一的),因此对应的矩阵有无穷多个,不方便分析。因此我们规定A是一个对称矩阵,这样,A就是唯一的了。
若f(x1,⋯,xn)=XTAX,我们称这个实对称矩阵A为该二次型的矩阵,称A的秩r(A)为这个二次型的秩。
标准二次型的矩阵是对角矩阵。
可逆线性变量替换
二次型XTAX,令X=CY,那么YT(CTAC)Y也是二次型(因为CTAC是对称矩阵),如果此时CTAC恰好是对角型,这样就能通过换元把普通二次型换为标准二次型。
设有一个n元二次型f(x1,x2,⋯,xn),引进新的一组变量y1,y2,⋯,yn,并把x1,x2,⋯,xn用它们表示
⎩⎨⎧x1=c11y1+c12y2+⋯+c1nynx2=c21y1+c22y2+⋯+c2nyn⋮xn=cn1y1+cn2y2+⋯+cnnyn(要求c11c21⋯cn1c12c22⋯cn2⋯⋯⋯⋯c1nc2n⋯cnn是可逆矩阵)
代入f(x1,x2,⋯,xn),得到y1,⋯,yn的一个二次型g(y1,⋯,yn),这样的操作称为对f(x1,⋯,xn)做了一次可逆线性变量替换。
设Y=(y1,y2,⋯,yn)T,则上面的变换式可以写成X=CY,则f(x1,⋯,xn)=XTAX=YTCTACY=g(y1,⋯,yn),于是g(y1,⋯,yn)的矩阵为CTAC,(CTAC)T=CTAT(CT)T=CTAC.
实对称矩阵的合同
两个n阶实对称矩阵A和B,如果存在n阶实可逆矩阵C,使得CTAC=B,称A于B合同,记作A⋍B。
命题:二次型f(x1,⋯,xn)=XTAX可用可逆线性变换替换为g(y1,⋯.yn)=YTBY⇔A⋍B.
2. 正交矩阵
向量的内积
定义:两个n维实向量α、β的内积是一个数,记作(α,β),规定为它们对于分量乘积之和。
设α=a1a2⋮an,β=b1b2⋮bn,则(α,β)=a1b1+a2b2+⋯+anbn=αTβ.
内积的性质:
(1)对称性:(α,β)=(β,α).
(2)双线性性质:(α1+α2,β)=(α1,β)+(α2,β),(α,β1+β2)=(α,β1)+(α,β2),(cα,β)=c(α,β)=(α,cβ).
(3)正交性:(α,α)≥0,(α,α)=∑i=1nai2。若(α,α)=0⇔α=0,
向量α的长度∣∣α∣∣=(α,α)=∑i=1nai2,∣∣α∣∣=0⇔α=0.
单位向量:长度为1的向量。比如100,220−22等。若α=0,则∣∣α∣∣α是单位向量,称这个过程为α的单位化。
证明:∣∣∣∣α∣∣α∣∣=∣∣α∣∣1∣∣α∣∣=1.
两个向量α、β如果内积为0,即(α,β)=0,则称它们是正交的。
如果n维向量组α1,α2,⋯,αs两两正交,并且每个都是单位向量,则称为单位正交向量组。
正交矩阵
一个实n阶矩阵A如果满足AAT=E,就称A为正交矩阵,此时AT=A−1.
定理:A是正交矩阵⇔A的行向量组是单位正交向量组⇔A的列向量组是单位正交向量组。
证明:设A=(α1,α2,⋯,αn),则
ATA=∣∣α1∣∣2(α2,α1)⋯(αn,α1)(α1,α2)∣∣α2∣∣2⋯⋯⋯⋯(α1,αn)⋯⋯∣∣αn∣∣2
于是ATA=E⇔α1,α2,⋯,αn是单位正交向量组。
如果A正交,那么AT和A−1也是正交的。
证明:AT(AT)T=A−1A=E,A−1(A−1)T=AT(A−1)T=(A−1A)T=E.
施密特正交化方法
这时一个把线性无关的向量组改造为与之等价的单位正交向量组的方法。

β1的系数即β1与α2的cos夹角。相当于α2减β1在其方向上的投影,向量相减由后面向量指向前面向量。
设α1,α2,⋯,α3线性无关,施密特正交化方法步骤:
(1)正交化
β1=α1.
β2=α2−(β1,β1)(β1,α2)β1(设β2=α2−kβ1,(β2,β1)=(α2,β1)−k(β1,β1),当k=(β1.β1)(α2,β1)时,β2,β1正交).
β3=α3−(β1,β1)(β1,α3)β1−(β2,β2)(β2,α3)β2.
(2)单位化
令η1=∣∣β1∣∣β1,η2=∣∣β2∣∣β2,η3=∣∣β3∣∣β3,则η1,η2,η3是与α1,α2,α3等价的单位正交向量组。
实对称矩阵的对角化
设A是一个实对称矩阵,则
(1)A的每个特征值都是实数。
(2)对每个特征值λ,重数=n−r(λE−A),即A一定可以对角化。
(3)属于不同特征值的特征向量相互正交。(因此在实际找正交矩阵时,只需对同一特征值对应的特征向量之间施密特正交化即可,不同特征对应的特征向量本来就是正交的,无需再正交化)
于是,存在正交矩阵Q,使得Q−1AQ是对角矩阵。(若Q是正交矩阵,则称为正交相似)
3. 二次型的标准化和规范化
每个二次型都可以用可逆线性变量替换化为标准二次型和规范二次型。也就是说每个矩阵都会合同于对角矩阵和规范对角矩阵。
设A是一个实对称矩阵,则存在正交矩阵Q,使得D=Q−1AQ是对角矩阵。(QTAQ=Q−1AQ=D,A∼D,A⋍D)
标准化和规范化的方法
(1)正交变换法
步骤:①求特征值②找特征向量③将特征向量按列构成的矩阵U(此时U−1AU=B),正交化,单位化变成C,利用正交矩阵C−1=CT的性质,把原来的C−1AC=B转化为CTAC=B.
二次型XTAX,令X=CY,那么YT(CTAC)Y也是二次型,且此时CTAC是一个对角阵(对角线上是对应的特征值λi)。
(2)配方法
比如:x12−3x22+4x32−2x1x2+2x1x3−6x2x3=x12−2x1(x2−x3)+(x2−x3)2−(x2−x3)2−3x22+4x32−6x2x3=(x1−x2+x3)2−(4x22+4x2x3+x32)+x32+3x32=(x1−x2+x3)2−(2x2+x3)2+4x32=y12−y22+4y32
于是⎩⎨⎧y1=x1−x2+x3y2=2x2+x3y3=x3,写出⎩⎨⎧x1=⋯x2=⋯x3=⋯,然后根据方程写出X=CY的替换矩阵C.
特别地,对于只有交叉项无法配方的二次型,比如
2x1x2−4x1x3+10x2x3+5x3x4+x1x4,令⎩⎨⎧x1=y1−y2x2=y1+y2x3=y3x4=y4再进行配方。
(3)初等变换法
根据左乘初等矩阵Pi′可看作是做初等行变换,右乘初等矩阵Pi可看作是做初等列变换的性质,合同的操作实际上就是对A同时作初等行变换及对应的初等列变换,如果我们对E只做和A相同的初等列变换,那就可以得到替换矩阵C
PsT⋯P1TAP1⋯Ps=Λ,而EP1⋯Ps=C
对A作增广,变成(AE),再对增广矩阵的行和列同时相应的变换
变换准则:对A、E同时作初等列变换,只对A做相应的初等行变换,这样,当A化成对角矩阵时,E就化为了C.
所谓对应,举例来说,就是:
(1)交换1、3列,交换1、3行
(2)21乘以第3列,21乘以第3行
(3)21乘以第2列加到第3列上,21乘以第2行加到第3行上
例:
实二次型-二次型的标准化和规范化-初等变换法-01
惯性定理与惯性指数
定理:一个二次型用可逆线性变换替换化出的标准形的各个平方项的系数中,大于0的个数和小于0的个数是由原二次型所决定的,分别称为原二次型的正、负惯性
指数。
一个二次型化出的规范二次型在形式上是唯一的,也即相应的规范对角矩阵是唯一的。
用矩阵的语言来说:一个实对称矩阵A会同于唯一规范对角矩阵。
二次型的正、负惯性指数在可逆线性变量替换下不变;两个二次型可互相转化的充要条件是它们的正、负惯性指数相等。
实对称矩阵的正(负)惯性指数就等于正(负)特征值的个数。
4. 正定二次型与正定矩阵
定义:如果当x1,⋯,xn不全为0时,f(x1,x2,⋯,xn)>0,则称二次型f(x1,x2,⋯,xn)称为正定二次型。
例如,标准二次型f(x1,x2,⋯,xn)=d1x12+dxx22+⋯+dnxn2正定⇔di>0,i=1,2,⋯,n.
实对称矩阵正定,即二次型XTAX正定,也就是:当x=0时,XTAX>0.
例如实对角矩阵λ10000λ20000⋱0000λn正定⇔λi>0,i=1,2,⋯,n.
性质
(1)可逆线性变换替换保持正定性。
比如f(x1,x2,⋯,xn)变为g(y1,y2,⋯,yn),则它们同时正定或不正定。
(2)A⋍B,则A、B同时正定,或同时不正定。
比如B=CTAC,如果A正定,则对每个X=0,XTBX=XTCTACX=(CX)TA(CX)>0.
(3)若A正定,则以下命题是等价的
- A⋍E.
- 存在实可逆矩阵C,使得A=CTC.
- A的正惯性指数=n.
- A的特征值全大于0.
- A的每个顺序主子式全大于0.
设A是一个n阶矩阵,记Ar是A的西北角的r阶小方阵,称∣Ar∣为A的第r个顺序主子式(或r阶顺序主子式)
判别A正定的三种方法:
(1)顺序主子式法。
(2)特征值法。
(3)定义法。
附录:向量空间
- n维向量空间及其子空间
记为Rn由全部n维实向量构成的集合,这是一个规定了加法和数乘这两种线性运算的集合,我们把它称为n维向量空间.
设V是Rn的一个子集,如果它满足
(1)当α1,α2都属于V时,α1+α2也属于V。
(2)对V的每一个元素α和任何实数c,cα也在V中。
则称V为Rn的一个子空间。
例如n元齐次线性方程组AX=0的全部解构成Rn的一个子空间,称为AX=0的解空间
但是非齐次方程组AX=β的全部解则不构成Rn的子空间。
对于Rn中的一组元素α1,α2,⋯,αs,记它们的全部线性组合的集合为L(α1,α2,⋯,αs)={c1α1+c2α2+⋯+csαs∣ci任意},它也是Rn的一个子空间。
- 基、维数、坐标
设V是Rn的一个非0子空间(即它含有非0元素),称V的秩为其维数,记作dimV.
称V的排了次序的极大无关组为V的基。
例如AX=0的解空间的维数为n−r(A),它的每个有序的基础解系构成基。
又如dim[L(α1,α2,⋯,αs)]=r(α1,α2,⋯,αs).
设η1,η2,⋯,ηk是V的一个基,则V的每个元素α都可以用η1,η2,⋯,ηk唯一线性表示:α=c1η1+c2η2+⋯+ckηk。c称其中的系数(c1,c2,⋯,ck)为α关于基η1,η2,⋯,ηk的坐标,它是一个k维向量。
坐标有线性性质:
(1)两个向量和的坐标等于它们的坐标的和:
如果向量α和β关于基η1,η2,⋯,ηk的坐标分别维(c1,c2,⋯,ck)和(d1,d2,⋯,dk),则α+β关于基η1,η2,⋯,ηk的坐标为(c1+d1,c2+d2,⋯,ck+dk)=(c1,c2,⋯,ck)+(d1,d2,⋯,dk).
(2)向量的数乘的坐标等于坐标乘数
如果向量α关于基η1,η2,⋯,ηk的坐标为(c1,c2,⋯,ck),则cα关于基η1,η2,⋯,ηk的坐标为(cc1,cc2,⋯,cck)=c(c1,c2,⋯,ck).
坐标的意义:设V中的一个向量组α1,α2,⋯,αt关于基η1,η2,⋯,ηk的坐标依次为γ1,γ2,⋯,γt,则α1,α2,⋯,αt和γ1,γ2,⋯,γt有相同的线性关系。
于是,我们可以用坐标来判断向量组的相关性,计算秩和极大无关组等。
- 过渡矩阵、坐标变换公式
设η1,η2,⋯,ηk和ξ1,ξ2,⋯,ξk都是V的一个基,并设ξ1在η1,η2,⋯,ηk中的坐标为(c1,c2,⋯,ck),构造矩阵C=c11c21⋯ck1c12c22⋯ck2⋯⋯⋯⋯c1kc2k⋯ckk,称C为η1,η2,⋯,ηk到ξ1,ξ2,⋯,ξk的过渡矩阵。(ξ1,ξ2,⋯,ξk)=(η1,η2,⋯,ηk)C.
如果V中向量α在其η1,η2,⋯,ηk和ξ1,ξ2,⋯,ξk中的坐标分别为x=(x1,x2,⋯,xk)T和y=(y1,y2,⋯,yk)T,则α=(η1,η2,⋯,ηk)x,α=(ξ1,ξ2,⋯,ξk)y=(η1,η2,⋯,ηk)Cy,于是关系是x=Cy称为坐标变换公式。
- 规范正交基
如果V的一基η1,η2,⋯,ηk是单位正交向量,则称为规范正交基。
两个向量的内积等于在规范正交基下的它们坐标的内积。
设α的坐标为(c1,c2,⋯,ck),β的坐标为(d1,d2,⋯,dk),则(α,β)=c1d1+c2d2+⋯+ckdk。
两个规范正交基之间的过渡矩阵是正交矩阵。