《线性代数》学习笔记
这是新的一部分,研究的重点还是之前提到过的子空间,但是本节主要从正交的角度来探讨这些子空间具有的性质以及正交向量的特点等,回顾这个很重要的图:
在四个基本子空间中,提到对于秩为r的$m \times n$矩阵,其行空间($dim C(A^T)=r$)与零空间($dim N(A)=n-r$)同属于$\mathbb{R}^n$空间,其列空间($dim C(A)=r$)与左零空间($dim N(A^T)$=m-r)同属于$\mathbb{R}^m$空间。
1. 正交向量与子空间
1.1 正交基本概念
对于向量$x, y$,当$x^T \cdot y=0$即$x_1y_1+x_2y_x+\cdots+x_ny_n=0$时,有向量$x, y$正交。毕达哥拉斯定理中提到,直角三角形的三条边满足:
$$ \begin{aligned} \left\|\overrightarrow{x}\right\|^2+\left\|\overrightarrow{y}\right\|^2 &= \left\|\overrightarrow{x+y}\right\|^2 \\ x^Tx+y^Ty &= (x+y)^T(x+y) \\ x^Tx+y^Ty &= x^Tx+y^Ty+x^Ty+y^Tx \\ 0 &= x^Ty+y^Tx \qquad 对于向量点乘,x^Ty=y^Tx \\ 0 &= 2x^Ty \\ x^Ty &=0 \end{aligned} $$
由此得出,两正交向量的点积为$0$。另外,$x, y$可以为$0$向量,由于$0$向量与任意向量的点积均为零,所以$0$向量与任意向量正交。举个例子: $x=\begin{bmatrix}1\\2\\3\end{bmatrix}, y=\begin{bmatrix}2\\-1\\0\end{bmatrix}, x+y=\begin{bmatrix}3\\1\\3\end{bmatrix}$,有$\left\| \overrightarrow{x} \right\|^2=14, \left\| \overrightarrow{y} \right\|^2=5, \left\| \overrightarrow{x+y} \right\|^2=19$,而$x^Ty=1\times2+2\times (-1)+3\times0=0$。
向量$S$与向量$T$正交,则意味着$S$中的每一个向量都与$T$中的每一个向量正交。若两个子空间正交,则它们一定不会相交于某个非零向量。
1.2 零空间与行空间的正交关系
现在观察行空间与零空间,零空间是$Ax=0$的解,即$x$若在零空间,则$Ax$为零向量;
而对于行空间,有 $ \begin{bmatrix}row_1\\row_2\\ \vdots \\row_m\end{bmatrix} \Bigg[x\Bigg]= \begin{bmatrix}0\\0\\ \vdots\\ 0\end{bmatrix} $,可以看出: $$ \begin{bmatrix}row_1\end{bmatrix}\Bigg[x\Bigg]=0 \\ \begin{bmatrix}row_2\end{bmatrix}\Bigg[x\Bigg]=0 \\ \vdots \\ \begin{bmatrix}row_m\end{bmatrix}\Bigg[x\Bigg]=0 \\ $$
所以这个等式告诉我们,$x$同$A$中的所有行正交;
接下来还验证$x$是否与$A$中各行的线性组合正交, $ \begin{cases} c_1(row_1)^Tx=0 \\ c_2(row_2)^Tx=0 \\ \vdots \\ c_n(row_m)^Tx=0 \\ \end{cases} $,各式相加$(c_1row_1+c_2row_2+\cdots+c_nrow_m)^Tx=0$,得证。零空间与行空间之间是正交的。
我们可以说,行空间与零空间将$\mathbb{R}^n$分割为两个正交的子空间,同样的,列空间与左零空间将$\mathbb{R}^m$分割为两个正交的子空间。(行空间与零空间的维数之和正好为$n$)
举例,$A=\begin{bmatrix}1&2&5\\2&4&10\end{bmatrix}$,则可知$m=2, n=3, rank(A)=1, dim N(A)=2$。
有$Ax=\begin{bmatrix}1&2&5\\2&4&10\end{bmatrix}\begin{bmatrix}x_1\\x_2\\x_3\end{bmatrix}=\begin{bmatrix}0\\0\end{bmatrix}$,解得零空间的一组基$x_1=\begin{bmatrix}-2\\1\\0\end{bmatrix}\quad x_2=\begin{bmatrix}-5\\0\\1\end{bmatrix}$。而行空间的一组基为$r=\begin{bmatrix}1\\2\\5\end{bmatrix}$,零空间与行空间正交,在本例中行空间也是零空间的法向量。
补充一点,我们把行空间与零空间称为$n$维空间里的正交补,即零空间包含了所有与行空间正交的向量;同理列空间与左零空间为$m$维空间里的正交补,即左零空间包含了所有与零空间正交的向量。
1.3 无解方程的最优解
接下来看长方矩阵,$m>n$。对于这种矩阵,$Ax=b$中经常混入一些包含“坏数据”的方程,虽然可以通过筛选的方法去掉一些我们不希望看到的方程,但是这并不是一个稳妥的方法。
于是,我们引入一个重要的矩阵:$A^TA$。这是一个$n \times m$矩阵点乘$m \times n$矩阵,其结果是一个$n \times n$矩阵,应该注意的是,这也是一个对称矩阵,证明如下:
$$ (A^TA)^T=A^T(A^T)^T=A^TA $$
这一章节的核心就是$A^TAx=A^Tb$,这个变换可以将“坏方程组”变为“好方程组”。
既然无法求出解,那么我们就用一些手段求出方程最优解。类似于一种拟合。将方程改写成:
$$\mathbf{A}^T\mathbf{A} \vec{x} = \mathbf{A}^T \vec{b}$$
实际上并不是Ax = b的解;(线性回归)
举例,有$\begin{bmatrix}1&1\\1&2\\1&5\end{bmatrix}\begin{bmatrix}x_1\\x_2\end{bmatrix}=\begin{bmatrix}b_1\\b_2\\b_3\end{bmatrix}$,只有当$\begin{bmatrix}b_1\\b_2\\b_3\end{bmatrix}$在矩阵的列空间时,方程才有解。
现在来看$\begin{bmatrix}1&1&1\\1&2&5\end{bmatrix}\begin{bmatrix}1&1\\1&2\\1&5\end{bmatrix}=\begin{bmatrix}3&8\\8&30\end{bmatrix}$,可以看出此例中$A^TA$是可逆的。
并非所有$A^TA$都是可逆的,如$\begin{bmatrix}1&1&1\\3&3&3\end{bmatrix}\begin{bmatrix}1&3\\1&3\\1&3\end{bmatrix}=\begin{bmatrix}3&9\\9&27\end{bmatrix}$
注意到这是两个秩一矩阵相乘,其结果秩不会大于一
给出结论:$$ N(A^TA)=N(A)\\ $$
$$rank(A^TA)=rank(A)\\$$
$$A^TA可逆当且仅当N(A)为零向量,即A的列线性无关\\$$
本节主要学习了正交的概念,从向量之间的正交再到空间之间的正交,进而引出了零空间与行空间之间的正交。最后讨论并引出了解决 AX = b无解时的方法,这部分是本章核心所在。
2024-08-02
Comments | NOTHING