文档介绍:协方差和相关系数公式
探究协方差和相关系数
罗燕
摘要:协方差Cov是描述二维随机变量两个分量间相互关联程度的一个特征数,假如将协方差对应标准化变量就得到相关系数Corr。从而能够引进相关系数Corr去刻画二维随机变量两个分量间相互关联程度。且事实表明,相关系数显著被广泛应用。本文的目标在于从协方差和相关系数的关系的角度去探讨协方差和相关系数的优缺点,并详细介绍协方差和相关系数这两个描述二维随机变量间相关性的特征数。 关键字:协方差Cov 相关系数Corr 相互关联程度
1 协方差、相关系数的定义及性质
设是一个二维随机变量,若E{ [ X-E ] [ Y-E ] }存在,则称此数学期望为X和Y的协方差,并记为Cov=E{ [ X-E ] [ Y-E ] },尤其有Cov=Var。
从协方差的定义能够看出,它是X的偏差“X-E ”和Y的偏差“Y-E”的乘积的数学期望。因为偏差可正可负,故协方差也可正可负,也可为零,其详细表现以下:
·当Cov>0时,称X和Y正相关,这时两个偏差 [ X-E ] 和[ Y-E ] 同时增加或同时降低,因为E和E全部是常数,故等价于X和Y同时增加或同时降低,这就是正相关的含义。
·当Cov
·当Cov=0时,称X和Y不相关。
也就是说,协方差就是用来描述二维随机变量X和Y相互关联程度的一个特征数。协方差Cov是有量纲的量,譬如X表示人的身高,单位是米,Y表示人的体重,单位是千克,则Cov带有量纲。为了消除量纲的影响,对协方差除以相同量纲的量,就得到一个新的概念—相关系数,它的定义以下:
设是一个二维随机变量,且Var>0,Var>
Cov
Cov Corr==σxσ y
为X和Y的相关系数。
利用施瓦茨不等式我们不难得到-1≤Corr≤-1到1之间的,而且能够对它作以下几点说明:
·若Corr=0,则称X和Y不相关。不相关是指X和Y没有线性关系,但也有可能有其它关系,比如平方关系、立方关系等。
·若Corr=1,则称X和Y完全正相关;若Corr=-1,则称X和Y完全,负相关。
·若0
2 协方差和相关系数的一致性
从协方差和相关系数的定义和性质我们不难发觉,协方差和相关系数全部是反应X和Y相关程度的量。也就是说,她们有异曲同工之效。在刻画二维随机变量两个分量间相互关联程度时,她们保持了一致性。这一点我能够给出以下两个例子来说明。
例一 设随机变量X和Y独立同服从参数为λ的泊松分布,令
U=2X+Y, V=2X-Y。
求U和V的协方差及相关系数。
解:因为
Var=Var=5λ,Var=Var=5λ.
因此
Cov=Cov
=Cov+Cov-Cov-Cov
=3λ
由此得
Corr=Cov
=3λ
5λ=3
5
服从参数为λ的泊松分布中得λ>0,由协方差Cov=3λ是恒大于0的,再由相关
3系数Corr=,就很好的说明协方差和相关系数均能够反应二维随机变量关联程度。5
我们再看下一个例题,看能否能出这个结论呢?
例二 将一枚硬币反复掷n次,以X