矩阵及其运算
线性方程组和矩阵
⎩⎨⎧a11x1+a12x1+⋯+a1nxn=b1a21x1+a22x1+⋯+a2nxn=b2⋯am1x1+am2x1+⋯+amnxn=bm(1) ⎩⎨⎧a11x1+a12x1+⋯+a1nxn=0a21x1+a22x1+⋯+a2nxn=0⋯am1x1+am2x1+⋯+amnxn=0(2) 当(1)式中b1,b2,⋯,bm不全为 0 的时候,线性方程组叫n 元非齐次线性方程组
全为 0 的时候就是(2)式,叫做n 元齐次线性方程组
对于齐次线性方程组一定有零解,即x1=x2=⋯=xn=0
其余的解叫非 0 解,但是非 0 解不一定存在
对于线性方程组需要讨论以下问题
(1)是否有解
(2)解是否唯一
(3)如果有多个解,如何求出所有的解
这几个问题的答案完全取决于 m×n个系数以及右端的常数项b1,b2,b3,⋯,bm 所构成的m行n+1列的矩形数表
a11a21⋮am1a12a22⋮am2⋯⋯⋱⋯a1na2n⋮amnb1b2⋮bm 对于
齐次线性方程组(2),相应的答案也完全取决于它的m×n个系数aij所构成的m行n列的矩形数表
a11a21⋮am1a12a22⋮am2⋯⋯⋱⋯a1na2n⋮amn 由此引入了矩阵的概念
定义:由 m×n个数aij排成的m行n列的数表称为m×n矩阵,记作
Am×n=a11a21⋮am1a12a22⋮am2⋯⋯⋱⋯a1na2n⋮amn 数aij位于矩阵A的第i行j列,称为矩阵A的(i,j)元,以数aij为(i,j)元的矩阵可以简称为(aij)或(aij)m×n
元素是实数的矩阵称为实矩阵,元素是复数的矩阵称为复矩阵
行数列数都等于n的矩阵称为n阶方阵,也记作An。
只有一行的矩阵叫行矩阵,又称行向量
只有一列的矩阵叫列矩阵,又称列向量
行数和列数相同的矩阵叫同型矩阵,同型矩阵对应元素相等,则矩阵相等
元素都是零的矩阵称作零矩阵,记作O,注意不同型的零矩阵是不同的
对于下列线性方程组
⎩⎨⎧a11x1+a12x1+⋯+a1nxn=b1a21x1+a22x1+⋯+a2nxn=b2⋯am1x1+am2x1+⋯+amnxn=bm A=(aij)称为系数矩阵,x=x1x2⋮xn称为未知数矩阵,b=b1b2⋮bn 称为常数项矩阵
B=a11a21⋮am1a12a22⋮am2⋯⋯⋱⋯a1na2n⋮amnb1b2⋮bm称为增广矩阵
对角方阵是指从左上角到右下角的直线(对角线)以外的元素都是 0 的矩阵,记作
Λ=λ10⋮00λ2⋮0⋯⋯⋱⋯00⋮λn=diag(λ1,λ2,⋯,λn) 当λ1=λ2=⋯=λn=1时,其对应的n阶方阵叫做单位矩阵,记作E
矩阵的运算
矩阵加法
两个同型矩阵才能进行加法运算,假设有俩m×n矩阵A=(aij) 和 B=(bij),那么矩阵A+B规定为
A+B=a11+b11a21+b21⋮am1+bm1a12+b12a22+b22⋮am2+bm2⋯⋯⋱⋯a1n+b1na2n+b2n⋮amn+bmn 同型矩阵加法满足的运算规律
A+B(A+B)+C=B+A=A+(B+C) 设矩阵A=(aij) ,记 −A=(−aij) −A称为矩阵A的负矩阵,显然有A+(−A)=O
由此规定矩阵的减法为A−B=A+(−B)
数与矩阵相乘
数λ 与矩阵A的乘积记作λA或者Aλ,规定为
λA=Aλ=λa11λa21⋮λam1λa12λa22⋮λam2⋯⋯⋱⋯λa1nλa2n⋮λamn 数乘满足的运算规律
(λμ)A(λ+μ)Aλ(A+B)=λ(μA)=λA+μA=λA+λB 矩阵加法和数乘统称为矩阵的线性运算
矩阵与矩阵相乘
{y1=a11x1+a12x2+a13x3y2=a21x1+a22x2+a23x3(1)⎩⎨⎧x1=b11t1+b12t2x2=b21t1+b22t2x3=b31t1+b32t2(2) 出t1,t2 到 y1,y2的线性变换,得
{y1=(a11b11+a12b21+a13b31)t1+(a11b12+a12b22+a13b32)t2y2=(a21b11+a22b21+a23b31)t1+(a21b12+a22b22+a23b32)t2(3) 我们把线性变换3叫做线性变换(1)与(2)的乘积,相应把(3)对应的矩阵定义为(1),(2)所对应矩阵的乘积
(a11a21a12a22a13a23)b11b21b31b12b22b32=(a11b11+a12b21+a13b31a21b11+a22b21+a23b31a11b12+a12b22+a13b32a21b12+a22b22+a23b32) 定义,设A=(aij)是一个m×s矩阵,B=(bij)是一个s×n矩阵,那么规定矩阵A与矩阵B的乘积是一个
m×n矩阵C=(cij)
矩阵乘法不满足交换律,但是满足结合律和分配律(假设运算都是可行的)
(AB)Cλ(AB)A(B+C)(B+C)AEA=A(BC)=(λA)B=A(λB)=AB+AC=BA+CA=AE=A λE称为纯量阵
矩阵的幂定义为:A1=A,A2=A1A1,⋯,Ak+1=AkA1,Ak是k个A连乘,显然只有方阵的幂才有意义
矩阵的幂满足的运算规律 : AkAl=Ak+l,(Ak)l=Akl
对于两个n阶矩阵A和B,一般来说(AB)k=AkBk,只有当A和B可交换的时候,才有(AB)k=AkBk。(A+B)2=A2+2AB+B2,(A−B)(A+B)=A2−B2 这俩公式,也只有当 A 和 B 可交换的时候才成立
矩阵的转置
把矩阵A的行换成同序数的列得到一个新的矩阵,叫做A的转置矩阵
例如
A=(132−101),AT=1203−11 转置满足的运算规律
(AT)T(A+B)T(λB)T(AB)T=A=AT+BT=λAT=BTAT 设A 为 n 阶方阵,如果满足AT=A,即aij=aji ,那么 A 称为对称矩阵
方阵的行列式
由n阶方阵A的元素构成的行列式(各个元素位置不变),称为方阵A的行列式,记作detA或∣A∣
n阶方阵是n2个数按一定方式排列成的数表,而n阶行列式则是数表里的数按一定的运算规律法则所确定的一个数
由A确定∣A∣的这个运算满足下述运算规律(A和B是n阶方阵,λ是常数)
∣AT∣∣λA∣∣AB∣=∣A∣=λn∣A∣=∣A∣∣B∣=∣BA∣(1) 证明(1)
构造 D=A−EOB=a11a21−10a12a220−100b11b2100b12b22,有∣D∣=∣A∣∣B∣
Dc3+b11c1+b21c2a11a21−10a12a220−1a11b11+a12b21a21b11+a22b210000b12b22c4+b12c1+b22c2a11a21−10a12a220−1a11b11+a12b21a21b11+a22b2100a11b12+a12b22a21b12+a22b2200=A−EXO 可以看出 X=AB,最后再对行列式进行两次对换 r1↔r3,r2↔r4
D=(−1)2A−EXO=(−1)2∣−E∣∣X∣=∣X∣=∣AB∣
伴随矩阵
行列式∣A∣的各个元素的代数余子式Aij所构成的如下矩阵称为矩阵A的伴随矩阵,简称伴随阵
A∗=A11A12⋮A1nA21A22⋮A2n⋯⋯⋱⋯An1An2⋮Ann 伴随矩阵有如下性质 AA∗=A∗A=∣A∣E
逆矩阵
定义: 对于 n 阶矩阵 A,如果有一个矩阵 B 使得 AB=BA=E,则称A是可逆的,并把矩阵B称为A的逆矩阵,可逆矩阵都是唯一的,A的逆矩阵记作A−1
定理
定理 1:若矩阵A可逆,则∣A∣=0
定理 2:若∣A∣=0,则矩阵A可逆,且A−1=∣A∣1A∗
当∣A∣=0时,A称为奇异矩阵,否则称为非奇异矩阵,可逆矩阵就是非奇异矩阵
推论:若AB=E或BA=E,则B=A−1
逆矩阵的用途
例 1
已知A,B,C,求X使得AXB=C
解:
A−1AXBB−1X=A−1CB−1=A−1CB−1 例 2
已知P=(1124),Λ=(1002),且AP=PΛ,求An
解:
AA2AnΛnAn=PΛP−1=PΛP−1PΛP−1=PΛ2P−1⋯=PΛnP−1=(1002n)=(2−2n2−2n+12n−12n+1−1) 定义φ(A)=a0E+a1A+⋯+amAm,φ(A)称为矩阵A的m次多项式
我们常用例2的方式来计算A的多项式φ(A)
如果A=PΛP−1,则Ak=PΛkP−1,从而
φ(A)=a0E+a1A+⋯+amAm=Pa0EP−1+Pa1ΛP−1+⋯+PamΛmP−1=Pφ(Λ)P−1 如果 Λ=diag(λ1,λ2,⋯,λn),则Λ=diag(λ1k,λ2k,⋯,λnk)
从而
φ(Λ)=a0E+a1Λ+⋯+amΛm=a010⋮001⋮0⋯⋯⋱⋯00⋮1+a1λ10⋮00λ2⋮0⋯⋯⋱⋯00⋮λn+⋯+amλ1m0⋮00λ2m⋮0⋯⋯⋱⋯00⋮λnm=φ(λ1)0⋮00φ(λ2)⋮0⋯⋯⋱⋯00⋮φ(λn)
上式表明当Λ为n阶对角矩阵的时候,φ(A)也是n阶对角矩阵,且他的第i个对角元是φ(λi),于是原来的运算就归结为数的多项式运算,给计算带来很大的方便
但是怎么构造P和Λ呢
克拉默法则
克拉默法则:如果线性方程组的系数矩阵A的行列式不等于零,那么方程组有唯一解
∣A∣=a11⋮an1⋯⋱⋯a1n⋮ann=0 x1=∣A∣∣A1∣,x2=∣A∣∣A2∣,⋯,xn=∣A∣∣An∣ Aj=a11⋮an1⋯⋱⋯a1,j−1⋮an,j−1b1⋮bna1,j+1⋮an,j+1⋯⋱⋯a1n⋮ann 证明:
Ax=bx=A−1bx1x2⋮xn=∣A∣1A11A12⋮A1nA21A22⋮A2n⋯⋯⋯⋯An1An2⋮Annb1b2⋮bn=∣A∣1b1A11+b2A21+⋯+bnAn1b1A12+b2A22+⋯+bnAn2⋮b1A1n+b2A2n+⋯+bnAnnxj=∣A∣1(b1A1j+b2A2j+⋯+bnAnj)=∣A∣1∣Aj∣ bn 位于Aj矩阵的(n,j),再结合行列式的性质:行列式等于它任一行或者列的各个元素和其对应的代数余子式乘积之和,由此可以完成从b1A1j+b2A2j+⋯+bnAnj 到 ∣Aj∣的推导
矩阵分块法
对于行数列数比较高的矩阵A,运算时通常采用分块法,使大矩阵的运算化成小矩阵的运算,将矩阵A用若干条纵线和横线划分成多个小矩阵,每个矩阵称为子块,以子块为元素的形式上的矩阵称为分块矩阵
设A为n阶方阵,若A的分块矩阵只有在对角线上有非零子块,其余子块都为零矩阵,且在对角线上的子块都是方阵,即
A=A1O⋮OOA2⋮O⋯⋯⋱⋯OO⋮As 其中Ai(i=1,2,⋯,s)都是方阵,那么称A为分块对角矩阵
分块对角矩阵的性质如下
∣A∣=∣A1∣∣A2∣∣A3∣⋯∣As∣
若∣Ai∣=0(i=1,2,⋯,s),则∣A∣=0,并有
A−1=A1−1O⋮OOA2−1⋮O⋯⋯⋱⋯OO⋮As−1