概率论基础

参考PCA数学原理,小结PCA求解过程中相关的概率论基础

方差和协方差

方差参考方差 标准差,用于衡量一组数据的离散程度,值越大,表示数据分布越广

Var(X)=D(X)=1Ni=1N(xiμ)2

协方差用于判断两组数据之间的相关程度,直观上看,协方差是两个变量总体误差的期望

Cov(X,Y)=E[(XE(X)(YE(Y))]=1Ni=1N(xiμx)(yiμy)

协方差矩阵

X=(X1,X2,...,XN)Tn维随机变量,称矩阵

C=(cij)n×n=(c11c12c1nc21c22c2ncn1cn2cnn)

n维随机变量X的协方差矩阵(covariance matrix),记为D(X),其中

cij=Cov(Xi,Xj),i,j=1,2,...,n

X的分量XiXj的协方差

以二维随机变量(X_{1}, X_{2})为例,协方差为

C=(E[X1E(X1)]2E[X1E(X1)]E[X2E(X2)]E[X2E(X2)]E[X1E(X1)]E[X2E(X2)]2)

所以协方差矩阵是实对称矩阵元素为实数,矩阵转置等于本身

协方差矩阵C的对角元素cii表示变量Xi的方差,非对角元素cij表示变量XiXj的协方差

相关阅读