线代 A1 笔记 第 11 部分(正交矩阵与欧氏空间)

Last updated on November 24, 2023 11:06 AM

本节内容考虑的数域均为实数域

欧式空间

内积是正定对称双线性函数。

  • 双线性:(kα+lβ,γ)=k(α,γ)+l(β,γ)(k\alpha+l\beta,\gamma)= k(\alpha,\gamma) + l (\beta,\gamma);且 (γ,kα+lβ)=k(γ,α)+l(γ,β)(\gamma,k\alpha+l\beta) = k(\gamma,\alpha)+l(\gamma,\beta)k,lR\forall k,l\in \mathbb{R}
  • 对称性:(α,β)=(β,α)(\alpha,\beta)=(\beta,\alpha)
  • 正定性:(α,α)0(\alpha,\alpha)\ge 0,等号成立当且仅当 α=0\alpha=0

这里我们只考虑标准内积。α=(a1,,an)T,β=(b1,,bn)TRn\alpha=(a_1, \cdots ,a_n)^T,\beta=(b_1, \cdots ,b_n)^T\in \mathbb{R}^n 的标准内积定义为

(α,β)=i=1naibi(\alpha,\beta) = \sum_{i=1}^na_ib_i

若集合 XX 上有二元函数 d(x,y)d(x,y),满足

  1. x,yX\forall x,y\in Xd(x,y)0d(x,y)\ge 0,等号成立当且仅当 x=yx=y
  2. d(x,y)=d(y,x)d(x,y) = d(y,x)
  3. d(x,y)+d(y,z)d(x,z)d(x,y)+d(y,z)\ge d(x,z)

则称 d(x,y)d(x,y)XX 上的距离函数(X,d)(X,d) 称为度量空间。

在欧氏空间中,向量的长度定义为 α:=(α,α)|\alpha|:=\sqrt{(\alpha,\alpha)},欧式距离被定义为 αβ:=(αβ,αβ)|\alpha-\beta|:=\sqrt{(\alpha-\beta,\alpha-\beta)}

欧氏距离满足三角不等式 α+βα+β|\alpha|+|\beta|\ge |\alpha+\beta|

下面看柯西不等式的向量形式:

(α,α)(β,β)(α,β)2(\alpha,\alpha)(\beta,\beta)\ge(\alpha,\beta)^{2}

证明:由内积的正定性,tR\forall t\in \mathbb{R}(αtβ,αtβ)0(\alpha-t\beta,\alpha-t\beta)\ge 0,利用双线性性拆开得 (α,α)2t(α,β)+t2(β,β)0(\alpha,\alpha)-2t(\alpha,\beta)+t^2(\beta,\beta)\ge 0,显然其为关于 tt 的二次函数,当 t=(α,β)(β,β)t = \displaystyle \frac{(\alpha,\beta)}{(\beta,\beta)} 的时候整个式子取得最小值。即 (α,α)2(α,β)(α,β)(β,β)+(α,β)(α,β)(β,β)0(\alpha,\alpha) - \displaystyle \frac{2(\alpha,\beta)(\alpha,\beta)}{(\beta,\beta)} + \frac{(\alpha,\beta)(\alpha,\beta)}{(\beta,\beta)}\ge 0,即 (α,α)(β,β)(α,β)2(\alpha,\alpha)(\beta,\beta)\ge (\alpha,\beta)^2。而若等号恰好可以取到,则 α\alphaβ\beta 共线。

在几何空间中,夹角便可以使用内积定义:cosα,β=(α,β)αβ\cos\langle \alpha,\beta \rangle =\displaystyle \frac{(\alpha,\beta)}{|\alpha||\beta|}

而当 cosα,β=0\cos\langle \alpha,\beta \rangle =0 的时候,αβ\alpha\perp \beta,称 α\alphaβ\beta 正交。

标准正交基与正交矩阵

定义:欧氏空间中,由非零向量组成的两两正交的向量组称为正交向量组。

AA 的列向量组为正交向量组     ATA\iff A^TA 是对角元皆大于 00 的对角阵     rank(A)=rank(ATA)    A\implies \operatorname{rank}(A) = \operatorname{rank}(A^TA) \implies A 的列数     A\iff A 的列向量组线性无关。

定理:正交向量组一定线性无关。

证明:设 α1,,αs\alpha_1, \cdots ,\alpha_s 为正交向量组,若有 k1α1++ksαs=0k_1\alpha_1 + \cdots + k_s\alpha_s = 0,则 j\forall j(k1α1++ksαs,αj)=0(k_1\alpha_1 + \cdots + k_s\alpha_s, \alpha_j) = 0,利用内积的线性性拆开,kjαj=0k_j\alpha_j = 0,所以 kj=0k_j = 0,所以 j\forall jkj=0k_j =0,证毕。

长度为 11 的向量被称为单位向量,非零向量可以单位化1αα\displaystyle \frac{1}{|\alpha|}\alpha

VV 为欧氏空间 Rn\mathbb{R}^n 的子空间,由单位正交向量组构成的基底称为 VV标准正交基

不难发现:α1,,αr\alpha_1, \cdots ,\alpha_r 构成 C(A)\mathcal{C}(A) 的标准正交基     ATA=Ir\iff A^TA = I_r

Rn\mathbb{R}^n 的标准正交基 α1,,αn\alpha_1, \cdots ,\alpha_n 排成的方阵 AA 称为正交矩阵

注意到,若 AA 为正交矩阵,则

ATA=[α1Tα2TαnT][α1α2αn]=[α1Tα1α1Tα2α1Tαnα2Tα1α2Tα2α2TαnαnTα1αnTα2αnTαn]=In\begin{aligned} A^TA &= \begin{bmatrix} \alpha_1^T \\ \alpha_2^T \\ \vdots \\ \alpha_n^T \\\end{bmatrix}\begin{bmatrix} \alpha_1 & \alpha_2 & \cdots & \alpha_n \\\end{bmatrix} \\ &= \begin{bmatrix} \alpha_1^T\alpha_1 & \alpha_1^T\alpha_2 & \cdots & \alpha_1^T\alpha_n \\ \alpha_2^T\alpha_1 & \alpha_2^T\alpha_2 & \cdots & \alpha_2^T\alpha_n \\ \vdots & \vdots & & \vdots \\ \alpha_n^T\alpha_1 & \alpha_n^T\alpha_2 & \cdots & \alpha_n^T\alpha_n \\\end{bmatrix} = I_n \end{aligned}

中间那个被叫做 Gram 矩阵

实方阵为正交矩阵,当且仅当其满足如下等价条件:

  • ATA=IA^TA = I
  • AAT=IAA^T=I
  • A1=ATA^{-1} = A^T
  • AA 的行/列向量组构成 Rn\mathbb{R}^n 的一组标准正交基。

正交矩阵有如下性质:

  • 正交矩阵的乘积仍为正交矩阵。
    证明:AB(AB)T=ABBTAT=A(BBT)AT=AAT=IAB(AB)^T = ABB^TA^T = A(BB^T)A^T = AA^T = I
  • 正交矩阵的逆/转置仍为正交矩阵。
    显然,不证。
  • 正交矩阵的行列式等于 ±1\pm 1
    显然,不证。
  • 正交矩阵给出正交变换:左乘正交矩阵 AA,向量的长度,向量间的夹角保持不变。
    证明:α,βRn\forall \alpha,\beta\in \mathbb{R}^n(Aα,Aβ)=(Aα)TAβ=αTATAβ=αTβ=(α,β)(A\alpha,A\beta) = (A\alpha)^TA\beta = \alpha^TA^TA\beta = \alpha^T\beta = (\alpha,\beta)

考虑欧氏空间 R2\mathbb{R}^2 的标准正交基。

  • 第一类正交矩阵:A=[cosθsinθsinθcosθ]A = \begin{bmatrix} \cos\theta & -\sin \theta \\ \sin \theta & \cos \theta \\\end{bmatrix},左乘其,相当于让向量逆时针旋转 θ\theta 角。考虑他的第一列和第二列就是 i^\hat{i}j^\hat{j} 变换后的结果。
  • 第二类正交矩阵:A=[cosθsinθsinθcosθ]A = \begin{bmatrix} \cos\theta & \sin \theta \\ \sin \theta & -\cos \theta \\\end{bmatrix},左乘其,相当于让向量关于 θ/2\theta / 2 角镜面反射。

子空间的交、和与直和

V1,V2VV_1,V_2\subseteq V,则

  1. V1V2V_1\cap V_2VV 的子空间。
  2. 一般而言,V1V2V_1\cup V_2 不是 VV 的子空间。
    考虑 V1V_1 为一个平面,V2V_2 为穿过平面的直线,显然其不满足关于加法的封闭性。当然,若 V1V_1V2V_2 有相互包含的关系,则 V1V2V_1\cup V_2 能为 VV 的子空间。

定义子空间的和:{α+βαV1,βV2}\left\{ \alpha+\beta\mid \alpha\in V_1,\beta\in V_2 \right\}VV 的子空间,称为 V1V_1V2V_2 的和,记作 V1+V2V_1 + V_2

V1+V2V_1+V_2 中每个向量写成 α+β (αV1,βV2)\alpha + \beta~(\alpha\in V_1,\beta\in V_2) 的方式唯一,则称 V1+V2V_1+V_2直和,记作 V1V2V_1\oplus V_2。这等价于 V1V2={0}V_1\cap V_2=\left\{ 0 \right\}

子空间的维数公式:dim(V1+V2)=dimV1+dimV2dim(V1V2)\operatorname{dim}(V_1+V_2)=\operatorname{dim}V_1+\operatorname{dim}V_2-\operatorname{dim}(V_1\cap V_2)dim(V1V2)=dimV1+dimV2\operatorname{dim}(V_1\oplus V_2)=\operatorname{dim}V_1+\operatorname{dim}V_2

正交投影与 Schmidt 正交化

VV 为欧氏空间 Rn\mathbb{R}^n 的子空间,则集合 V:={αRn(α,β)=0,βV}V^\perp := \left\{ \alpha\in R^n|\mid (\alpha,\beta)=0, \forall \beta\in V \right\} 也为 Rn\mathbb{R}^n 的子空间,称为 VV正交补

定理:

  • V+V=RnV+V^{\perp}=\mathbb{R}^n

  • VV={0}V\cap V^{\perp}=\left\{ 0 \right\}

  • dimV=ndimV\operatorname{dim} V^{\perp}=n-\operatorname{dim}V

  • C(A)=N(AT)\mathcal{C}(A)^{\perp}=\mathcal{N}(A^T)
    这是什么原理呢?要找到所有和 AA 的列向量正交的向量,那不就是转置之后解方程 ATX=0A^TX=0 么。

    这给了我们一种很快的求正交补的基的方法。比如说对于 V=α1,α2R4V=\langle \alpha_1,\alpha_2 \rangle \subseteq \mathbb{R}^4,其中 α1=(1,1,2,1)T,α2=(1,0,0,2)T\alpha_1=(1,1,2,1)^T,\alpha_2=(1,0,0,-2)^T,欲求 VV^\perp,则我们解方程:

    [11211002]X=0\begin{bmatrix} 1&1&2&1\\1&0&0&-2 \end{bmatrix} X = 0

    即可,变成 rref,得到 [10020123]\begin{bmatrix}1&0&0&-2\\0&1&2&3\end{bmatrix}。得到 {x1=2x4x2=2x33x4\begin{cases} x_1=2x_4 \\ x_2=-2x_3-3x_4 \end{cases},故解空间的基底:(0,2,1,0)T(0,-2,1,0)^T(2,3,0,1)T(2,-3,0,1)^T

定理:αRn\forall \alpha\in R^n 和子空间 VV,必在 VV 中找到唯一向量 β\beta s. t. αβV\alpha-\beta\perp V,此时 αβ|\alpha-\beta|α\alphaVV 的最短距离,即 γV\{β}\forall \gamma \in V \backslash \left\{ \beta \right\}αβ<αγ|\alpha-\beta|<|\alpha-\gamma|β\beta 称为 α\alpha VV 上的正交投影

固定 VV 的一组正交基 β1,,βr\beta_1, \cdots ,\beta_r,则 β=k1β1++krβrV\beta = k_1\beta_1 + \cdots + k_r\beta_r\in Vα\alphaVV 上的正交投影     αβV    i\iff \alpha - \beta \perp V \iff \forall i(αk1β1krβr,βi)=0    (α,βi)ki(βi,βi)=0    ki=(α,βi)(βi,βi)(\alpha-k_1\beta_1- \cdots -k_r\beta_r,\beta_i) = 0 \iff (\alpha,\beta_i) - k_i(\beta_i,\beta_i)=0 \iff k_i=\displaystyle \frac{(\alpha,\beta_i)}{(\beta_i,\beta_i)}。这是存在且唯一的。

所以如果已知子空间正交基,求正交投影是容易的:

β=i=1r(α,βi)(βi,βi)βi\begin{aligned} \beta = \sum_{i=1}^r \frac{(\alpha,\beta_i)}{(\beta_i,\beta_i)}\beta_i \\ \end{aligned}

更进一步地,如果 β1,,βr\beta_1, \cdots ,\beta_r标准正交基,则 βi=βiβ=βi(βi,βi)\displaystyle \beta_i = \frac{\beta_i}{|\beta|} = \frac{\beta_i}{(\beta_i,\beta_i)},所以:

β=(α,β1)β1+(α,β2)β2++(α,βr)βr=β1(β1Tα)+β2(β2Tα)++β(βrTα)=(β1β1T++βrβrT)α=BBTα\begin{aligned} \beta &= (\alpha,\beta_1)\beta_1 + (\alpha,\beta_2)\beta_2+ \cdots +(\alpha,\beta_r)\beta_r \\ &= \beta_1(\beta_1^T\alpha)+\beta_2(\beta_2^T\alpha)+ \cdots +\beta(\beta_r^T\alpha)\\ &=(\beta_1\beta_1^T+ \cdots +\beta_r\beta_r^T)\alpha\\ &= BB^T\alpha \end{aligned}

BBTBB^T 就是投影矩阵。回顾一下之前说的那个 BB+BB^+,注意到 B+=(BTB)1BT=BTB^+ = (B^TB)^{-1}B^T = B^TBB 为正交矩阵),故对得上号。

而现在我们好奇,如果有一个线性无关的向量组,我们如何使其变为等价的正交向量组?

比如对于 α1,,αs\alpha_1, \cdots ,\alpha_s,不妨直接令 β1=α1\beta_1=\alpha_1,然后考虑求 β2\beta_2 使得 β2β1\beta_2\perp\beta_1β1,β2α1,α2\beta_1,\beta_2\cong \alpha_1,\alpha_2。发现我们可以考虑求 α2\alpha_2β1\langle \beta_1 \rangle 上的投影,根据上面的公式,这个投影就是 (α2,β1)(β1,β1)β1\displaystyle \frac{(\alpha_2,\beta_1)}{(\beta_1,\beta_1)}\beta_1。而要求 β2\beta_2,其即为用 α2\alpha_2 减去这个投影:β2=α2(α2,β1)(β1,β1)\beta_2=\displaystyle \alpha_2-\frac{(\alpha_2,\beta_1)}{(\beta_1,\beta_1)}

对于剩下的,都是类似的,我们一个一个的进行。一般地,

βr=αri=1r1(αr,βi)(βi,βi)βi\beta_r = \alpha_r-\sum_{i=1}^{r-1}\frac{(\alpha_r,\beta_i)}{(\beta_i,\beta_i)}\beta_i

此过程即为 Schmidt 正交化。想要得到单位向量组也是容易的,单位化即可。

正交投影的一些应用

QR 分解

我们观察如下式子:

β1=α1β2=α2(α2,β1)(β1,β1)β1β3=α3(α3,β1)(β1,β1)β1(α3,β2)(β2,β2)β2\begin{aligned} \beta_1&=\alpha_1 \\ \beta_2&=\alpha_2-\frac{(\alpha_2,\beta_1)}{(\beta_1,\beta_1)}\beta_1\\ \beta_3&=\alpha_3-\frac{(\alpha_3,\beta_1)}{(\beta_1,\beta_1)}\beta_1-\frac{(\alpha_3,\beta_2)}{(\beta_2,\beta_2)}\beta_2 \end{aligned}

改写一下,把 α\alpha 放在一边:

α1=β1α2=(α2,β1)β12β1+β2α3=(α3,β1)β12β1+(α3,β2)β22β2+β3\begin{aligned} \alpha_1 &= \beta_1 \\ \alpha_2 &= \frac{(\alpha_2,\beta_1)}{|\beta_1|^{2}}\beta_1+\beta_2\\ \alpha_3&= \frac{(\alpha_3,\beta_1)}{|\beta_1|^{2}}\beta_1+\frac{(\alpha_3,\beta_2)}{|\beta_2|^{2}}\beta_2+\beta_3 \end{aligned}

拆成矩阵乘法的形式:

A=[α1α2α3]=[β1β1β2β2β3β3][β1(α2,β1)β1(α3,β1)β1β2(α3,β2)β2β3]=QR\begin{aligned} A &= \begin{bmatrix} \alpha_1 & \alpha_2 & \alpha_3 \\\end{bmatrix} \\ &= \begin{bmatrix} \frac{\beta_1}{|\beta_1|} & \frac{\beta_2}{|\beta_2|} & \frac{\beta_3}{|\beta_3|} \\\end{bmatrix} \begin{bmatrix} |\beta_1| & \frac{(\alpha_2,\beta_1)}{|\beta_1|} & \frac{(\alpha_3,\beta_1)}{|\beta_1|} \\ & |\beta_2| & \frac{(\alpha_3,\beta_2)}{|\beta_2|} \\ & & |\beta_3| \\\end{bmatrix}\\ &= QR \end{aligned}

定理:满秩的实矩阵都能唯一地写成 QRQR 的形式,QQ 为正交矩阵,RR 为对角元都为正的上三角阵。

最小二乘解

找一个 XX 使得 AXβ|AX-\beta| 取得最小值。注意到

AXβ=(a11x1++a1nxnb1)2++(am1x1++amnxnbm)2|AX-\beta| = \sqrt{(a_{11}x_1 + \cdots +a_{1n}x_n-b_1)^{2} + \cdots + (a_{m1}x_1 + \cdots + a_{mn}x_n - b_m)^{2}}

这个最小肯定在 AX=γAX=\gamma 的时候取到,其中 γ\gammaβ\betaC(A)\mathcal{C}(A) 的正交投影。

AA 列满秩的时候,ATAX=ATβA^TAX=A^T\beta 有唯一解,X=A+βX = A^+\beta,其即为正交投影在列空间基底 α1,,αn\alpha_1, \cdots ,\alpha_n 下的坐标。

而由 AX=AA+βAX=A A^+\betaAA+βA A^+ \beta 就是所谓的那个投影啦。

回归直线与最小二乘法

给定 nn(ai,bi)(a_i,b_i),确定一个 y=kx+ly=kx+l s. t. 这些点到直线的距离平方和最小。

即,找到一个 k,lk,l s. t. i=1n(bikail)2\displaystyle \sum_{i=1}^n(b_i-ka_i-l)^{2} 最小。

A=[α1α2]=[1a11a21an]A = \begin{bmatrix} \alpha_1 & \alpha_2 \\\end{bmatrix}=\begin{bmatrix} 1 & a_{1} \\ 1 & a_2 \\\vdots&\vdots\\ 1&a_n\\\end{bmatrix}β=[b1b2bn]\beta = \begin{bmatrix} b_1 \\ b_2 \\ \vdots \\ b_n \\\end{bmatrix}。那么 i=1n(bikail)2=βkα2lα12\displaystyle \sum_{i=1}^n(b_i-ka_i-l)^{2} = |\beta-k\alpha_2-l\alpha_1|^{2}

这不就相当于要找 X=[lk]R2X = \begin{bmatrix} l \\ k \\\end{bmatrix}\in \mathbb{R}^{2} 使得 βAX|\beta - AX| 最小吗。

找最小二乘解就可以了,AA 列满秩,于是 X=(ATA)1ATβX = (A^TA)^{-1}A^T\beta


线代 A1 笔记 第 11 部分(正交矩阵与欧氏空间)
https://blog.imyangty.com/note-linear-algebra-a1/11/
Author
YangTY
Posted on
November 21, 2023
Licensed under