Last updated on November 24, 2023 11:06 AM
本节内容考虑的数域均为实数域
欧式空间
内积是正定的对称双线性函数。
- 双线性:(kα+lβ,γ)=k(α,γ)+l(β,γ);且 (γ,kα+lβ)=k(γ,α)+l(γ,β),∀k,l∈R。
- 对称性:(α,β)=(β,α)
- 正定性:(α,α)≥0,等号成立当且仅当 α=0。
这里我们只考虑标准内积。α=(a1,⋯,an)T,β=(b1,⋯,bn)T∈Rn 的标准内积定义为
(α,β)=i=1∑naibi
若集合 X 上有二元函数 d(x,y),满足
- ∀x,y∈X 有 d(x,y)≥0,等号成立当且仅当 x=y;
- d(x,y)=d(y,x);
- d(x,y)+d(y,z)≥d(x,z)。
则称 d(x,y) 为 X 上的距离函数,(X,d) 称为度量空间。
在欧氏空间中,向量的长度定义为 ∣α∣:=(α,α),欧式距离被定义为 ∣α−β∣:=(α−β,α−β)
欧氏距离满足三角不等式 ∣α∣+∣β∣≥∣α+β∣。
下面看柯西不等式的向量形式:
(α,α)(β,β)≥(α,β)2
证明:由内积的正定性,∀t∈R 有 (α−tβ,α−tβ)≥0,利用双线性性拆开得 (α,α)−2t(α,β)+t2(β,β)≥0,显然其为关于 t 的二次函数,当 t=(β,β)(α,β) 的时候整个式子取得最小值。即 (α,α)−(β,β)2(α,β)(α,β)+(β,β)(α,β)(α,β)≥0,即 (α,α)(β,β)≥(α,β)2。而若等号恰好可以取到,则 α 与 β 共线。
在几何空间中,夹角便可以使用内积定义:cos⟨α,β⟩=∣α∣∣β∣(α,β)。
而当 cos⟨α,β⟩=0 的时候,α⊥β,称 α 与 β 正交。
标准正交基与正交矩阵
定义:欧氏空间中,由非零向量组成的两两正交的向量组称为正交向量组。
A 的列向量组为正交向量组 ⟺ATA 是对角元皆大于 0 的对角阵 ⟹rank(A)=rank(ATA)⟹A 的列数 ⟺A 的列向量组线性无关。
定理:正交向量组一定线性无关。
证明:设 α1,⋯,αs 为正交向量组,若有 k1α1+⋯+ksαs=0,则 ∀j 有 (k1α1+⋯+ksαs,αj)=0,利用内积的线性性拆开,kjαj=0,所以 kj=0,所以 ∀j 有 kj=0,证毕。
长度为 1 的向量被称为单位向量,非零向量可以单位化:∣α∣1α。
设 V 为欧氏空间 Rn 的子空间,由单位正交向量组构成的基底称为 V 的标准正交基。
不难发现:α1,⋯,αr 构成 C(A) 的标准正交基 ⟺ATA=Ir。
由 Rn 的标准正交基 α1,⋯,αn 排成的方阵 A 称为正交矩阵。
注意到,若 A 为正交矩阵,则
ATA=⎣⎢⎢⎢⎢⎡α1Tα2T⋮αnT⎦⎥⎥⎥⎥⎤[α1α2⋯αn]=⎣⎢⎢⎢⎢⎡α1Tα1α2Tα1⋮αnTα1α1Tα2α2Tα2⋮αnTα2⋯⋯⋯α1Tαnα2Tαn⋮αnTαn⎦⎥⎥⎥⎥⎤=In
中间那个被叫做 Gram 矩阵。
实方阵为正交矩阵,当且仅当其满足如下等价条件:
- ATA=I;
- AAT=I;
- A−1=AT;
- A 的行/列向量组构成 Rn 的一组标准正交基。
正交矩阵有如下性质:
- 正交矩阵的乘积仍为正交矩阵。
证明:AB(AB)T=ABBTAT=A(BBT)AT=AAT=I。
- 正交矩阵的逆/转置仍为正交矩阵。
显然,不证。
- 正交矩阵的行列式等于 ±1。
显然,不证。
- 正交矩阵给出正交变换:左乘正交矩阵 A,向量的长度,向量间的夹角保持不变。
证明:∀α,β∈Rn,(Aα,Aβ)=(Aα)TAβ=αTATAβ=αTβ=(α,β)。
考虑欧氏空间 R2 的标准正交基。
- 第一类正交矩阵:A=[cosθsinθ−sinθcosθ],左乘其,相当于让向量逆时针旋转 θ 角。考虑他的第一列和第二列就是 i^ 和 j^ 变换后的结果。
- 第二类正交矩阵:A=[cosθsinθsinθ−cosθ],左乘其,相当于让向量关于 θ/2 角镜面反射。
子空间的交、和与直和
设 V1,V2⊆V,则
- V1∩V2 为 V 的子空间。
- 一般而言,V1∪V2 不是 V 的子空间。
考虑 V1 为一个平面,V2 为穿过平面的直线,显然其不满足关于加法的封闭性。当然,若 V1 与 V2 有相互包含的关系,则 V1∪V2 能为 V 的子空间。
定义子空间的和:{α+β∣α∈V1,β∈V2} 为 V 的子空间,称为 V1 与 V2 的和,记作 V1+V2。
若 V1+V2 中每个向量写成 α+β (α∈V1,β∈V2) 的方式唯一,则称 V1+V2 为直和,记作 V1⊕V2。这等价于 V1∩V2={0}。
子空间的维数公式:dim(V1+V2)=dimV1+dimV2−dim(V1∩V2),dim(V1⊕V2)=dimV1+dimV2。
正交投影与 Schmidt 正交化
设 V 为欧氏空间 Rn 的子空间,则集合 V⊥:={α∈Rn∣∣(α,β)=0,∀β∈V} 也为 Rn 的子空间,称为 V 的正交补。
定理:
-
V+V⊥=Rn;
-
V∩V⊥={0};
-
dimV⊥=n−dimV;
-
C(A)⊥=N(AT)。
这是什么原理呢?要找到所有和 A 的列向量正交的向量,那不就是转置之后解方程 ATX=0 么。
这给了我们一种很快的求正交补的基的方法。比如说对于 V=⟨α1,α2⟩⊆R4,其中 α1=(1,1,2,1)T,α2=(1,0,0,−2)T,欲求 V⊥,则我们解方程:
[1110201−2]X=0
即可,变成 rref,得到 [100102−23]。得到 {x1=2x4x2=−2x3−3x4,故解空间的基底:(0,−2,1,0)T 和 (2,−3,0,1)T。
定理:∀α∈Rn 和子空间 V,必在 V 中找到唯一向量 β s. t. α−β⊥V,此时 ∣α−β∣ 为 α 到 V 的最短距离,即 ∀γ∈V\{β} 有 ∣α−β∣<∣α−γ∣。β 称为 α 在 V 上的正交投影。
固定 V 的一组正交基 β1,⋯,βr,则 β=k1β1+⋯+krβr∈V 为 α 在 V 上的正交投影 ⟺α−β⊥V⟺∀i 有 (α−k1β1−⋯−krβr,βi)=0⟺(α,βi)−ki(βi,βi)=0⟺ki=(βi,βi)(α,βi)。这是存在且唯一的。
所以如果已知子空间正交基,求正交投影是容易的:
β=i=1∑r(βi,βi)(α,βi)βi
更进一步地,如果 β1,⋯,βr 为标准正交基,则 βi=∣β∣βi=(βi,βi)βi,所以:
β=(α,β1)β1+(α,β2)β2+⋯+(α,βr)βr=β1(β1Tα)+β2(β2Tα)+⋯+β(βrTα)=(β1β1T+⋯+βrβrT)α=BBTα
BBT 就是投影矩阵。回顾一下之前说的那个 BB+,注意到 B+=(BTB)−1BT=BT(B 为正交矩阵),故对得上号。
而现在我们好奇,如果有一个线性无关的向量组,我们如何使其变为等价的正交向量组?
比如对于 α1,⋯,αs,不妨直接令 β1=α1,然后考虑求 β2 使得 β2⊥β1 且 β1,β2≅α1,α2。发现我们可以考虑求 α2 在 ⟨β1⟩ 上的投影,根据上面的公式,这个投影就是 (β1,β1)(α2,β1)β1。而要求 β2,其即为用 α2 减去这个投影:β2=α2−(β1,β1)(α2,β1)。
对于剩下的,都是类似的,我们一个一个的进行。一般地,
βr=αr−i=1∑r−1(βi,βi)(αr,βi)βi
此过程即为 Schmidt 正交化。想要得到单位向量组也是容易的,单位化即可。
正交投影的一些应用
QR 分解
我们观察如下式子:
β1β2β3=α1=α2−(β1,β1)(α2,β1)β1=α3−(β1,β1)(α3,β1)β1−(β2,β2)(α3,β2)β2
改写一下,把 α 放在一边:
α1α2α3=β1=∣β1∣2(α2,β1)β1+β2=∣β1∣2(α3,β1)β1+∣β2∣2(α3,β2)β2+β3
拆成矩阵乘法的形式:
A=[α1α2α3]=[∣β1∣β1∣β2∣β2∣β3∣β3]⎣⎢⎢⎡∣β1∣∣β1∣(α2,β1)∣β2∣∣β1∣(α3,β1)∣β2∣(α3,β2)∣β3∣⎦⎥⎥⎤=QR
定理:满秩的实矩阵都能唯一地写成 QR 的形式,Q 为正交矩阵,R 为对角元都为正的上三角阵。
最小二乘解
找一个 X 使得 ∣AX−β∣ 取得最小值。注意到
∣AX−β∣=(a11x1+⋯+a1nxn−b1)2+⋯+(am1x1+⋯+amnxn−bm)2
这个最小肯定在 AX=γ 的时候取到,其中 γ 为 β 在 C(A) 的正交投影。
当 A 列满秩的时候,ATAX=ATβ 有唯一解,X=A+β,其即为正交投影在列空间基底 α1,⋯,αn 下的坐标。
而由 AX=AA+β,AA+β 就是所谓的那个投影啦。
回归直线与最小二乘法
给定 n 个 (ai,bi),确定一个 y=kx+l s. t. 这些点到直线的距离平方和最小。
即,找到一个 k,l s. t. i=1∑n(bi−kai−l)2 最小。
记 A=[α1α2]=⎣⎢⎢⎢⎢⎡11⋮1a1a2⋮an⎦⎥⎥⎥⎥⎤,β=⎣⎢⎢⎢⎢⎡b1b2⋮bn⎦⎥⎥⎥⎥⎤。那么 i=1∑n(bi−kai−l)2=∣β−kα2−lα1∣2。
这不就相当于要找 X=[lk]∈R2 使得 ∣β−AX∣ 最小吗。
找最小二乘解就可以了,A 列满秩,于是 X=(ATA)−1ATβ。