# 矩阵及其运算

# 线性方程组和矩阵

\begin{dcases} a_{11}x_1 + a_{12}x_1 + \cdots + a_{1n}x_n = b_1 \\ a_{21}x_1 + a_{22}x_1 + \cdots + a_{2n}x_n = b_2 \\ \cdots \\ a_{m1}x_1 + a_{m2}x_1 + \cdots + a_{mn}x_n = b_m \\ \end{dcases} \qquad (1) \\ \begin{dcases} a_{11}x_1 + a_{12}x_1 + \cdots + a_{1n}x_n = 0 \\ a_{21}x_1 + a_{22}x_1 + \cdots + a_{2n}x_n = 0 \\ \cdots \\ a_{m1}x_1 + a_{m2}x_1 + \cdots + a_{mn}x_n = 0 \\ \end{dcases} \qquad (2)

当 $(1)$ 式中 $b_1,b_2,\cdots,b_m$ 不全为 0 的时候，线性方程组叫n 元非齐次线性方程组
全为 0 的时候就是 $(2)$ 式，叫做n 元齐次线性方程组

对于齐次线性方程组一定有零解，即 $x_1 = x_2 = \cdots = x_n = 0$
其余的解叫非 0 解，但是非 0 解不一定存在

对于线性方程组需要讨论以下问题
(1)是否有解
(2)解是否唯一
(3)如果有多个解，如何求出所有的解
这几个问题的答案完全取决于 $m \times n$ 个系数以及右端的常数项 $b_1,b_2,b_3,\cdots,b_m$ 所构成的 $m$ 行 $n+1$ 列的矩形数表

\begin{matrix} a_{11} & a_{12} & \cdots & a_{1n} & b_1 \\ a_{21} & a_{22} & \cdots & a_{2n} & b_2 \\ \vdots & \vdots & \ddots & \vdots & \vdots \\ a_{m1} & a_{m2} & \cdots & a_{mn} & b_m \end{matrix}

对于
齐次线性方程组 $(2)$ ，相应的答案也完全取决于它的 $m\times n$ 个系数 $a_{ij}$ 所构成的 $m$ 行 $n$ 列的矩形数表

\begin{matrix} a_{11} & a_{12} & \cdots & a_{1n} \\ a_{21} & a_{22} & \cdots & a_{2n} \\ \vdots & \vdots & \ddots & \vdots \\ a_{m1} & a_{m2} & \cdots & a_{mn} \end{matrix}

由此引入了矩阵的概念

定义：由 $m\times n$ 个数 $a_{ij}$ 排成的 $m$ 行 $n$ 列的数表称为 $m\times n$ 矩阵，记作

A_{m\times n} = \begin{pmatrix} a_{11} & a_{12} & \cdots & a_{1n} \\ a_{21} & a_{22} & \cdots & a_{2n} \\ \vdots & \vdots & \ddots & \vdots \\ a_{m1} & a_{m2} & \cdots & a_{mn} \end{pmatrix}

数 $a_{ij}$ 位于矩阵 $A$ 的第 $i$ 行 $j$ 列，称为矩阵 $A$ 的 $(i,j)$ 元，以数 $a_{ij}$ 为 $(i,j)$ 元的矩阵可以简称为 $(a_{ij})$ 或 $(a_{ij})_{m\times n}$

元素是实数的矩阵称为实矩阵，元素是复数的矩阵称为复矩阵

行数列数都等于 $n$ 的矩阵称为 $n$ 阶方阵，也记作 $A_n$ 。
只有一行的矩阵叫行矩阵，又称行向量
只有一列的矩阵叫列矩阵，又称列向量

行数和列数相同的矩阵叫同型矩阵，同型矩阵对应元素相等，则矩阵相等
元素都是零的矩阵称作零矩阵，记作 $O$ ，注意不同型的零矩阵是不同的

对于下列线性方程组

\begin{dcases} a_{11}x_1 + a_{12}x_1 + \cdots + a_{1n}x_n = b_1 \\ a_{21}x_1 + a_{22}x_1 + \cdots + a_{2n}x_n = b_2 \\ \cdots \\ a_{m1}x_1 + a_{m2}x_1 + \cdots + a_{mn}x_n = b_m \\ \end{dcases}

$A=(a_{ij})$ 称为系数矩阵， $x=\begin{pmatrix}x_1 \\ x_2 \\ \vdots \\ x_n\end{pmatrix}$ 称为未知数矩阵， $b=\begin{pmatrix}b_1 \\ b_2 \\ \vdots \\ b_n\end{pmatrix}$ 称为常数项矩阵
$B=\begin{matrix} a_{11} & a_{12} & \cdots & a_{1n} & b_1 \\ a_{21} & a_{22} & \cdots & a_{2n} & b_2 \\ \vdots & \vdots & \ddots & \vdots & \vdots \\ a_{m1} & a_{m2} & \cdots & a_{mn} & b_m \end{matrix}$ 称为增广矩阵

对角方阵是指从左上角到右下角的直线(对角线)以外的元素都是 0 的矩阵，记作

\Lambda = \begin{pmatrix} \lambda_1 & 0 & \cdots & 0 \\ 0 & \lambda_2 & \cdots & 0 \\ \vdots & \vdots & \ddots & \vdots \\ 0 & 0 & \cdots &\lambda_n \end{pmatrix} = diag(\lambda_1,\lambda_2,\cdots,\lambda_n)

当 $\lambda_1=\lambda_2=\cdots=\lambda_n=1$ 时，其对应的 $n$ 阶方阵叫做单位矩阵，记作 $E$

# 矩阵的运算

# 矩阵加法

两个同型矩阵才能进行加法运算，假设有俩 $m\times n$ 矩阵 $A=(a_{ij})$ 和 $B=(b_ij)$ ，那么矩阵 $A+B$ 规定为

A+B = \begin{pmatrix} a_{11} + b_{11} & a_{12} + b_{12} & \cdots & a_{1n} + b_{1n} \\ a_{21} + b_{21} & a_{22} + b_{22} & \cdots & a_{2n} + b_{2n} \\ \vdots & \vdots & \ddots & \vdots \\ a_{m1} + b_{m1} & a_{m2} + b_{m2} & \cdots & a_{mn} + b_{mn} \\ \end{pmatrix}

同型矩阵加法满足的运算规律

\begin{align} A+B&=B+A \\ (A+B)+C&=A+(B+C) \end{align}

设矩阵 $A = (a_{ij})$ ，记 $-A = (-a_{ij})$ $-A$ 称为矩阵 $A$ 的负矩阵，显然有 $A + (-A) = O$
由此规定矩阵的减法为 $A - B = A + (-B)$

# 数与矩阵相乘

数 $\lambda$ 与矩阵 $A$ 的乘积记作 $\lambda A$ 或者 $A\lambda$ ，规定为

\lambda A = A \lambda = \begin{pmatrix} \lambda a_{11} & \lambda a_{12} & \cdots & \lambda a_{1n}\\ \lambda a_{21} & \lambda a_{22} & \cdots & \lambda a_{2n}\\ \vdots & \vdots & \ddots & \vdots \\ \lambda a_{m1} & \lambda a_{m2} & \cdots &\lambda a_{mn} \\ \end{pmatrix}

数乘满足的运算规律

\begin{align} (\lambda \mu)A &= \lambda(\mu A) \\ (\lambda + \mu)A &= \lambda A + \mu A \\ \lambda (A+B) &= \lambda A + \lambda B \\ \end{align}

矩阵加法和数乘统称为矩阵的线性运算

# 矩阵与矩阵相乘

\begin{align*} &\begin{dcases} y_1 = a_{11}x_1 + a_{12}x_2 + a_{13}x_3 \\ y_2 = a_{21}x_1 + a_{22}x_2 + a_{23}x_3 \end{dcases} \qquad(1) \\ \\ &\begin{dcases} x_1 = b_{11}t_1 + b_{12}t_2 \\ x_2 = b_{21}t_1 + b_{22}t_2 \\ x_3 = b_{31}t_1 + b_{32}t_2 \end{dcases} \qquad(2) \end{align*}

出 $t_1,t_2$ 到 $y_1,y_2$ 的线性变换，得

\begin{dcases} y_1 = (a_{11}b_{11} + a_{12}b_{21} + a_{13}b_{31})t_1 + (a_{11}b_{12} + a_{12}b_{22} + a_{13}b_{32})t_2 \\ y_2 = (a_{21}b_{11} + a_{22}b_{21} + a_{23}b_{31})t_1 + (a_{21}b_{12} + a_{22}b_{22} + a_{23}b_{32})t_2 \\ \end{dcases} \qquad(3)

我们把线性变换 $3$ 叫做线性变换 $(1)$ 与 $(2)$ 的乘积，相应把 $(3)$ 对应的矩阵定义为 $(1),(2)$ 所对应矩阵的乘积

\begin{pmatrix} a_{11} & a_{12} & a_{13} \\ a_{21} & a_{22} & a_{23} \\ \end{pmatrix} \begin{pmatrix} b_{11} & b_{12} \\ b_{21} & b_{22} \\ b_{31} & b_{32} \\ \end{pmatrix} = \begin{pmatrix} a_{11}b_{11} + a_{12}b_{21} + a_{13}b_{31} & a_{11}b_{12} + a_{12}b_{22} + a_{13}b_{32} \\ a_{21}b_{11} + a_{22}b_{21} + a_{23}b_{31} & a_{21}b_{12} + a_{22}b_{22} + a_{23}b_{32} \end{pmatrix}

定义，设 $A=(a_{ij})$ 是一个 $m\times s$ 矩阵， $B=(b_{ij})$ 是一个 $s\times n$ 矩阵，那么规定矩阵 $A$ 与矩阵 $B$ 的乘积是一个
$m\times n$ 矩阵 $C=(c_{ij})$

矩阵乘法不满足交换律，但是满足结合律和分配律(假设运算都是可行的)

\begin{align} (AB)C &= A(BC) \\ \lambda (AB) &= (\lambda A)B = A(\lambda B) \\ A(B+C) &= AB + AC \\ (B+C)A &= BA + CA \\ EA &= AE = A \end{align}

$\lambda E$ 称为纯量阵

矩阵的幂定义为: $A^1 = A, A^2 = A^1A^1,\cdots,A^{k+1} = A^kA^1$ ， $A^k$ 是 $k$ 个 $A$ 连乘，显然只有方阵的幂才有意义

矩阵的幂满足的运算规律 : $A^kA^l = A^{k+l}，(A^k)^l = A^{kl}$

对于两个 $n$ 阶矩阵 $A$ 和 $B$ ，一般来说 $(AB)^k\neq A^kB^k$ ，只有当 $A$ 和 $B$ 可交换的时候，才有 $(AB)^k = A^kB^k$ 。 $(A+B)^2=A^2+2AB+B^2,(A-B)(A+B) = A^2 - B^2$ 这俩公式，也只有当 $A$ 和 $B$ 可交换的时候才成立

# 矩阵的转置

把矩阵 $A$ 的行换成同序数的列得到一个新的矩阵，叫做 $A$ 的转置矩阵

例如

A = \begin{pmatrix} 1 & 2 & 0 \\ 3 & -1 & 1 \end{pmatrix}, A^T = \begin{pmatrix} 1 & 3 \\ 2 & -1 \\ 0 & 1 \end{pmatrix}

转置满足的运算规律

\begin{align} (A^T)^T &= A \\ (A+B)^T &= A^T + B^T \\ (\lambda B)^T &= \lambda A^T \\ (AB)^T &= B^TA^T \end{align}

设 $A$ 为 $n$ 阶方阵，如果满足 $A^T=A$ ，即 $a_{ij} = a_{ji}$ ，那么 $A$ 称为对称矩阵

# 方阵的行列式

由 $n$ 阶方阵 $A$ 的元素构成的行列式(各个元素位置不变)，称为方阵 $A$ 的行列式，记作 $detA$ 或 $|A|$

$n$ 阶方阵是 $n^2$ 个数按一定方式排列成的数表，而 $n$ 阶行列式则是数表里的数按一定的运算规律法则所确定的一个数

由 $A$ 确定 $|A|$ 的这个运算满足下述运算规律( $A$ 和 $B$ 是 $n$ 阶方阵, $\lambda$ 是常数)

\begin{align} |A^T| &= |A|\\ |\lambda A| &= \lambda^n |A| \\ |AB| &= |A||B| = |BA| \qquad(1) \end{align}

证明(1)

构造 $D = \begin{vmatrix} A & O \\ -E & B\end{vmatrix} = \begin{vmatrix} a_{11} & a_{12} & 0 & 0 \\ a_{21} & a_{22} & 0 & 0 \\ -1 & 0 & b_{11} & b_{12} \\ 0 & -1 & b_{21} & b_{22} \end{vmatrix}$ ,有 $|D| = |A||B|$

\begin{align*} D&\xlongequal{c_3+b_{11}c_1+b_{21}c_2} \begin{vmatrix} a_{11} & a_{12} & a_{11}b_{11} + a_{12}b_{21} & 0 \\ a_{21} & a_{22} & a_{21}b_{11} + a_{22}b_{21} & 0 \\ -1 & 0 & 0 & b_{12} \\ 0 & -1 & 0 & b_{22} \end{vmatrix} \\ &\xlongequal{c_4+b_{12}c_1+b_{22}c_2} \begin{vmatrix} a_{11} & a_{12} & a_{11}b_{11} + a_{12}b_{21} & a_{11}b_{12} + a_{12}b_{22} \\ a_{21} & a_{22} & a_{21}b_{11} + a_{22}b_{21} & a_{21}b_{12} + a_{22}b_{22} \\ -1 & 0 & 0 & 0 \\ 0 & -1 & 0 & 0 \end{vmatrix} \\ &= \begin{vmatrix} A & X \\ -E & O \end{vmatrix} \end{align*}

可以看出 $X = AB$ ，最后再对行列式进行两次对换 $r_1\leftrightarrow r_3,r_2\leftrightarrow r_4$

$D = (-1)^2\begin{vmatrix}A & X \\ -E & O\end{vmatrix} = (-1)^2|-E||X| = |X| = |AB|$

# 伴随矩阵

行列式 $|A|$ 的各个元素的代数余子式 $A_{ij}$ 所构成的如下矩阵称为矩阵 $A$ 的伴随矩阵，简称伴随阵

A^{\ast} = \begin{pmatrix} A_{11} & A_{21} & \cdots & A_{n1} \\ A_{12} & A_{22} & \cdots & A_{n2} \\ \vdots & \vdots & \ddots & \vdots \\ A_{1n} & A_{2n} & \cdots & A_{nn} \\ \end{pmatrix}

伴随矩阵有如下性质 $AA^{\ast}=A^{\ast}A = |A|E$

# 逆矩阵

定义: 对于 n 阶矩阵 A，如果有一个矩阵 B 使得 $AB = BA = E$ ，则称 $A$ 是可逆的，并把矩阵 $B$ 称为 $A$ 的逆矩阵，可逆矩阵都是唯一的， $A$ 的逆矩阵记作 $A^{-1}$

# 定理

定理 1:若矩阵 $A$ 可逆，则 $|A|\neq0$

定理 2:若 $|A|\neq0$ ，则矩阵 $A$ 可逆，且 $A^{-1}=\frac{1}{|A|}A^{\ast}$

当 $|A|=0$ 时， $A$ 称为奇异矩阵，否则称为非奇异矩阵，可逆矩阵就是非奇异矩阵

推论:若 $AB=E$ 或 $BA=E$ ，则 $B=A^{-1}$

# 逆矩阵的用途

# 例 1

已知 $A,B,C$ ，求 $X$ 使得 $AXB=C$

解:

\begin{align} A^{-1}AXBB^{-1} &= A^{-1}CB^{-1} \\ X &= A^{-1}CB^{-1} \end{align}

# 例 2

已知 $P=\begin{pmatrix}1 & 2 \\ 1 & 4 \end{pmatrix},\Lambda=\begin{pmatrix}1 & 0 \\ 0 & 2 \end{pmatrix}$ ，且 $AP=P\Lambda$ ，求 $A^n$

解:

\begin{align} A &= P\Lambda P^{-1} \\ A^2 &= P\Lambda P^{-1}P\Lambda P^{-1} = P\Lambda^2 P^{-1} \\ &\cdots \\ A^n &= P\Lambda^n P^{-1} \\ \Lambda^n &= \begin{pmatrix}1&0\\0&2^n\end{pmatrix} \\ A^n &= \begin{pmatrix} 2-2^n & 2^n -1 \\ 2-2^{n+1} & 2^{n+1} - 1 \end{pmatrix} \end{align} \\ \begin{align} \end{align}

定义 $\varphi(A)=a_0E + a_1A + \cdots + a_mA^m$ ， $\varphi(A)$ 称为矩阵 $A$ 的 $m$ 次多项式

我们常用例2的方式来计算 $A$ 的多项式 $\varphi(A)$

如果 $A = P\Lambda P^{-1}$ ，则 $A^k = P\Lambda^kP^{-1}$ ，从而

\begin{align} \varphi(A) &= a_0E + a_1A + \cdots + a_mA^m \\ &= Pa_0EP^{-1} + Pa_1\Lambda P^{-1} + \cdots + Pa_m\Lambda^m P^{-1} \\ &=P\varphi(\Lambda)P^{-1} \end{align}

如果 $\Lambda = diag(\lambda_1,\lambda_2,\cdots,\lambda_n)$ ，则 $\Lambda = diag(\lambda_1^k,\lambda_2^k,\cdots,\lambda_n^k)$

从而

\begin{align} \varphi(\Lambda) &= a_0E + a_1\Lambda + \cdots + a_m\Lambda_m \\ &=a_0\begin{pmatrix} 1 & 0 & \cdots & 0 \\ 0 & 1 & \cdots & 0 \\ \vdots & \vdots & \ddots & \vdots \\ 0 & 0 & \cdots &1 \end{pmatrix} + a_1\begin{pmatrix} \lambda_1 & 0 & \cdots & 0 \\ 0 & \lambda_2 & \cdots & 0 \\ \vdots & \vdots & \ddots & \vdots \\ 0 & 0 & \cdots &\lambda_n \end{pmatrix} + \cdots + a_m\begin{pmatrix} \lambda_1^m & 0 & \cdots & 0 \\ 0 & \lambda_2^m & \cdots & 0 \\ \vdots & \vdots & \ddots & \vdots \\ 0 & 0 & \cdots &\lambda_n^m \end{pmatrix} \\ &=\begin{pmatrix} \varphi(\lambda_1) & 0 & \cdots & 0 \\ 0 & \varphi(\lambda_2) & \cdots & 0 \\ \vdots & \vdots & \ddots & \vdots \\ 0 & 0 & \cdots &\varphi(\lambda_n) \end{pmatrix} \end{align}

上式表明当 $\Lambda$ 为 $n$ 阶对角矩阵的时候， $\varphi(A)$ 也是n阶对角矩阵，且他的第 $i$ 个对角元是 $\varphi(\lambda_i)$ ，于是原来的运算就归结为数的多项式运算，给计算带来很大的方便

但是怎么构造 $P$ 和 $\Lambda$ 呢

# 克拉默法则

克拉默法则:如果线性方程组的系数矩阵 $A$ 的行列式不等于零，那么方程组有唯一解

\begin{align} |A| &= \begin{vmatrix} a_{11} & \cdots & a_{1n} \\ \vdots & \ddots & \vdots \\ a_{n1} & \cdots & a_{nn} \end{vmatrix} \\ &\ne 0 \end{align}

x_1 = \frac{|A_1|}{|A|}, x_2 = \frac{|A_2|}{|A|}, \cdots, x_n = \frac{|A_n|}{|A|}

A_j = \begin{pmatrix} a_{11} & \cdots & a_{1,j-1} & b_1 & a_{1,j+1} & \cdots & a_{1n} \\ \vdots & \ddots & \vdots & \vdots & \vdots & \ddots & \vdots \\ a_{n1} & \cdots & a_{n,j-1} & b_n & a_{n,j+1} & \cdots & a_{nn} \end{pmatrix}

证明:

\begin{align} & Ax=b \\ & x=A^{-1}b \\ &\begin{align} \begin{pmatrix} x_1 \\ x_2 \\ \vdots \\ x_n \end{pmatrix} &= \frac{1}{|A|}\begin{pmatrix} A_{11} & A_{21} & \cdots & A_{n1} \\ A_{12} & A_{22} & \cdots & A_{n2} \\ \vdots & \vdots & \cdots & \vdots \\ A_{1n} & A_{2n} & \cdots & A_{nn} \\ \end{pmatrix} \begin{pmatrix} b_1\\ b_2\\ \vdots\\ b_n \end{pmatrix} \\\\ &= \frac{1}{|A|}\begin{pmatrix} b_1A_{11} + b_2A_{21} + \cdots + b_nA_{n1} \\ b_1A_{12} + b_2A_{22} + \cdots + b_nA_{n2} \\ \vdots \\ b_1A_{1n} + b_2A_{2n} + \cdots + b_nA_{nn} \\ \end{pmatrix} \end{align} \\\\ &x_j = \frac{1}{|A|}(b_1A_{1j} + b_2A_{2j} + \cdots + b_nA_{nj}) \\\\ &=\frac{1}{|A|}|A_j| \end{align}

$b_n$ 位于 $A_j$ 矩阵的 $(n,j)$ ，再结合行列式的性质：行列式等于它任一行或者列的各个元素和其对应的代数余子式乘积之和，由此可以完成从 $b_1A_{1j} + b_2A_{2j} + \cdots + b_nA_{nj}$ 到 $|A_j|$ 的推导

# 矩阵分块法

对于行数列数比较高的矩阵 $A$ ，运算时通常采用分块法，使大矩阵的运算化成小矩阵的运算，将矩阵 $A$ 用若干条纵线和横线划分成多个小矩阵，每个矩阵称为子块，以子块为元素的形式上的矩阵称为分块矩阵

设 $A$ 为 $n$ 阶方阵，若 $A$ 的分块矩阵只有在对角线上有非零子块，其余子块都为零矩阵，且在对角线上的子块都是方阵，即

A = \begin{pmatrix} A_1 & O &\cdots & O \\ O & A_2 &\cdots & O \\ \vdots &\vdots &\ddots & \vdots \\ O & O &\cdots & A_s \\ \end{pmatrix}

其中 $A_i(i=1,2,\cdots,s)$ 都是方阵，那么称 $A$ 为分块对角矩阵
分块对角矩阵的性质如下
$|A| = |A_1||A_2||A_3|\cdots|A_s|$

若 $|A_i|\ne 0(i=1,2,\cdots,s)$ ，则 $|A|\ne 0$ ，并有

A^{-1} = \begin{pmatrix} A_1^{-1} & O &\cdots & O \\ O & A_2^{-1} &\cdots & O \\ \vdots &\vdots &\ddots & \vdots \\ O & O &\cdots & A_s^{-1} \\ \end{pmatrix}

← 行列式矩阵的初等变化与线性方程组 →