线性代数基础

小结PCA求解过程中相关的线性代数基础(部分几何内容+概率论内容

  • 内积
  • 投影
  • 向量的线性相关/线性无关
  • 向量空间的基
  • 线性变换和线性映射
  • 矩阵降维
  • 特征值和特征向量
  • 正交向量组和正交矩阵
  • 实对称矩阵

内积

向量的内积既可以由向量坐标的代数运算得出,也可以通过引入两个向量的长度和角度的几何概念来计算得到

在欧几里得几何中,两个笛卡尔坐标向量的点积常称为内积

代数运算

给定n个实向量α=(a1,a2,...,an)T,β=(b1,b2,...,bn)T,称实数

[α,β]=a1b1+a2b2+...+anbn

为向量αβ的内积

几何运算

给定n元实向量α=(a1,a2,...,an)T,称

||α||=[α,α]=a12+a22+...+an2

为向量α的长度(范数或模)。长度为1的向量称为单位向量,对任一非零向量α,向量α||α||为单位向量,这一过程称为将向量α单位化(或规范化/标准化)

α,βn元实非零向量,记

<α,β>=arccos[α,β]||α||||β||,0≤<α,β>≤π

<α,β>为向量αβ的夹角

设二维空间有两个向量αβ,则内积定义如下:

αβ=||α||||β||cosθ

该定义只对二维和三维空间有效

投影

设两个非零向量αβ的夹角为θ,则将||β||cosθ叫做向量β在向量α方向上的投影,也称为标投影(scalar projection),是一个标量

引入α的单位矢量α(A),称||β||cosθα(A)βα上的矢投影(vector projection),是一个向量

投影和内积关系

设向量β1,则αβ的内积等于αβ所在直线投影的长度

αβ=||α||cos(θ)

向量的线性相关/线性无关

设向量组α1,α2,...,αmRn,如果存在一组不全为零的数k1,k2,...,km,满足

k1α1+k2α2+...+kmαm=0

则称向量组α1,α2,...,αm 线性相关;当且仅当k1=k2=...=km=0时上式才成立,则称向量组α1,α2,...,αm 线性无关

几何解释:在二维平面上,线性相关指向量在同一直线上,线性无关指向量不再同一直线上

向量空间的基

V是一个向量空间,α1,α2,...,αrV中的一组向量,如果满足

  1. α1,α2,...,αr线性无关
  2. V中的任一向量都可由α1,α2,...,αr线性表示

则称α1,α2,...,αrV中的一组,数r称为V的维数,记作dim(V)=r,并称Vr维向量空间

正交基

称基中的向量为基向量,如果基向量两两正交(向量内积为0),则称基为正交基,如果正交基的基向量的模长都是单位长度1,则称正交基为标准正交基

正交基中各基向量线性无关

基变换与坐标变换

α1,α2,...,αrβ1,β2,...,βr为向量空间V的基,有

(β1,β2,...,βr)=(α1,α2,...,αr)Pr×r

r阶矩阵P是由基α1,α2,...,αr到基β1,β2,...,βr的过渡矩阵,称上式为基变换公式

矩阵P是可逆矩阵

V是向量空间,α1,α2,...,αrβ1,β2,...,βr分别为V的基,且

X=(x1,x2,...,xr)TY=(y1,y2,...,yr)T

分别是向量aα1,α2,...,αrβ1,β2,...,βr的坐标,则有

X=PY  Y=P1X

其中P是由基α1,α2,...,αr到基β1,β2,...,βr的过渡矩阵,称上式为坐标变换公式

线性变换和线性映射

线性变换(linear transformation)指线性空间V到其自身的线性映射,也就是坐标变换

线性映射(linear mapping)指从一个向量空间V到另一个向量空间W的映射且保持加法和数量乘法运算

矩阵降维

假设有MN维向量组成的向量空间P,想要将其映射到由RN维向量组成的向量空间A,则计算如下:

PA=(p1p2pM)(a1,a2,,aR)RM×R

其中pi表示长度为N的行向量,aj表示长度为N的列向量

向量空间的矩阵乘法属于线性映射

如果R小于M,可以称线性映射为PA的投影

特征值和特征向量

An阶方阵,若存在数λn维非零向量X,使得

AX=λX

则称数λ为方阵A特征值;非零向量X称为A的对应于特征值λ特征向量

性质

定理一:设An阶矩阵,则ATA有相同的特征值

定理二:设λ1,λ2,...,λnn阶方阵A=(aij)n个特征值,则

i=1nλi=i=1naii

i=1nλi=|A|

其中i=1naiiA的主对角线元素之和,称为方阵A的迹,记作tr(A)

定理三:不同特征值对应的特征向量线性无关,也就是两两正交

求解

求解方阵A的特征值与特征向量:

  1. 计算A的特征多项式:f(λ)=|AλE|,其根λ1,λ2,...,λs(λiλj)就是As个不同的特征值

  2. 对每个特征值λi,i=1,2,...,s,解方程组(AλiE)X=0,其基础解系就是A的对应于特征值λi的线性无关的特征向量,其非零解就是A的对应于特征值λi的全部特征向量

特征值和投影关系

矩阵乘法AX相当于矩阵A在向量X上的投影,λ表示投影大小(以X为基)

特征值越大表示数据分布越广,离散程度大,所以其方差越大

正交向量组和正交矩阵

什么是正交向量?

α,β是两个n元实向量,若[λ,β]=0,则称λβ正交(或垂直),记为$$

向量αβ正交的充分必要条件是||α+β||2=||α||2+||β||2

什么是正交向量组?

若不含零向量的向量组中任意两个向量都正交,则称此向量组为正交向量组

由单位向量构成的正交向量组叫做正交单位向量组(规范正交向量组或标准正交向量组)

什么是正交矩阵?

An阶矩阵,如果AAT=E,则称A为正交矩阵

A为正交矩阵的充分必要条件是A的列(或行)向量组是单位正交向量组

正交向量组和基的关系

大小为n的正交向量组两两正交,比线性无关,可以视为n维空间的正交基

所以正交单位向量组可以视为标准正交基

实对称矩阵

定理一:设An阶实对称矩阵,λ0Ar重特征值,则A的属于特征值λ0恰有r个线性无关的特征向量,即R(Aλ0E)=nr

定理二:设An阶实对称矩阵,则存在n阶正交矩阵Q,使得

Q1AQ=QTAQ=Λ=diag(λ1,λ2,...,λn)

其中λ1,λ2,...,λnA的特征值

正交矩阵Q由特征值对应的特征向量正交化且单位化后组成,Q的第j列对应特征值λj

相关阅读