文档介绍:第三节协方差与相关系数
对于二维随机变量(X,Y),数学期望E(X),E(Y)只反映了X和Y各自的平均值,而D(X),D(Y)反映的是X和Y各自偏离平均值的程度,,每对随机变量往往相互影响、相互第三节协方差与相关系数
对于二维随机变量(X,Y),数学期望E(X),E(Y)只反映了X和Y各自的平均值,而D(X),D(Y)反映的是X和Y各自偏离平均值的程度,,每对随机变量往往相互影响、,人的年龄与身高;,它们也是一类重要的数字特征,本节讨论有关这方面的数字特征.
(X,Y)为二维随机变量,称
E{[X-E(X)][Y-E(Y)]}
为随机变量X,Y的协方差(Covariance),记为Cov(X,Y),即
Cov(X,Y)=E{[X-E(X)][Y-E(Y)]}.()
而称为随机变量X,Y的相关系数(Correlation coefficient)或标准协方差(Standard covariance),记为ρXY,即
ρXY=.()
特别地,
Cov(X,X)=E{[X-E(X)][X-E(X)]}=D(X),
Cov(Y,Y)=E{[Y-E(Y)][Y-E(Y)]}=D(Y).
故方差D(X),D(Y)是协方差的特例.
由上述定义及方差的性质可得
D(X±Y)=D(X)+D(Y)±2Cov(X,Y).
由协方差的定义及数学期望的性质可得下列实用计算公式
Cov(X,Y)=E(XY)-E(X)E(Y).()
若(X,Y)为二维离散型随机变量,其联合分布律为P{X=xi,Y=yj}=pij,i,j=1,2,…,则有
Cov(X,Y)=.()
若(X,Y)为二维连续型随机变量,其概率密度为f(x,y),则有
Cov(X,Y)=.()
(X,Y)的分布律为
表4-12
X
Y
01
0
1
1-p0
0p
0<p<1,求Cov(X,Y)和ρXY.
解易知X的分布律为
P{X=1}=p,P{X=0}=1-p,
故E(X)=p,D(X)=p(1-p).
同理E(Y)=p,D(Y)=p(1-p),因此
Cov(X,Y)=E(XY)-E(X)·E(Y)=p-p2=p(1-p),
而ρXY=
(X,Y)的概率密度为
f(x,y)=
求Cov(X,Y).
解由于fX(x)=fY(y)=
E(X)=,
E(Y)=,
E(XY)=
因此Cov(X,Y)=E(XY)-E(X)E(Y)=.
协方差具有下列性质:
1°若X与Y相互独立,则Cov(X,Y)=0;
2°Cov(X,Y)=Cov(Y,X);
3°Cov(aX,bY)=abCov(X,Y);
4°Cov(X1+X2,Y)=Cov(X1,Y)+Cov(X2,Y).
证仅证性质4°,其余留给读者.
Cov(X1+X2,Y) =E[(X1+X2)Y]-E(X1+X2)E(Y)
=E(X1Y)+E(X2Y)-E(X1)E(Y)-E(X2)E(Y)
=[E(X1Y)-E(X1)E(Y)]+[E