文档介绍:其中_仝,元和号分别为标准化变最,样本均值和样本标准差。
2
不论是样本的还是总体的Pearson相关系数绝对值均小「•等J: 1,相关系数等J: 1或・1时,所 自数据的点都梢确地落在一条直线I.(为样本相关系数的悄况〉,或是两变駅的 =—---:=」厂——=
IL』卜 || V1O3VOX)983
应该注意到,I••述数据是特意从完全线性相关的线性函数丫=0」0+,所以 Pearson相关系数应该将确地为1。将数据中心化(将X减去E(X)=38, Y减去E(Y)=),可得 X = (-28, -18, -, 12, 42), Y= (-, -, -, , ),并有
c x'y'
cos 0 * = = 厂 厂—= 1=0
IM|||y j| “
跟期塑的一样。
相关系数大小与相关性大小的关系
许多学者都提出了通过相关系数大小判断变鼠相关性的标准。但是正如Cohen (1988)所指出的 一样,这吐标准或£或少的的些武断,不川该过J:严格地遵守。相同相关系数对相关性人小的判断 取决J:不同的背景和LI的。,在使用很耕确的仪器验证物理定律的时候可能 彼认为是很低的,但是社会科学中,在评定许多复杂因素的贡献时,却可能被认为是很鬲的相关性。 相关系数与相关性的关系
相关性
负值
正值
不相关
--
〜
低相关
・0・3〜・Q1
0」〜
中等相关
・〜・Q3
〜
显著相关
・〜・Q5
〜
4
4」存在性
总体W Pearson相关系数是通过原点矩來定义的,所以二元概率分布的总体协方茅以及变杲边缘 总体反差必须是有意义IL是非冬的。一些概率分布例如柯西(Cauchy)分布的反差就是无意义的, 因此在X或Y服从这种分布时,p也是没冇意义的。在一些实际应用中,例如那些涉及数据在用部 比较集中的情况,考虑这点就是很匝耍的。但是,相关系数的存在性通常不是我们关注的焦点,因 为一般只耍分布是有界的,那么p就可以被定义。
在二元正态分布中,若已知变量的边缘分布的均值和标准羞,那么山Pearson相关系数就可以 完全确定该分布的特性。但是对「贞它的二元分布,情况就冇所不同。然而,不论变起之间的联介 概率密度两数是不是正态的,。 対J:二元正态数据,样本的相关系数是总体相关系数的极人似然佔计,并Eiur渐进无偏性和何效 性,也即是说在数据來门正态分布,且样本人小适中或是足够人的时候,不可能构造-个比样本相 II:疋态总体,样本相关系数依然是渐进无 偏的,但是可能不是有效的估计。只耍样本均值、方差、协方差是一致的(可以通过应用大数定律 來保证),样本相关系数是总体相关系数的一个一致估计量。
U0二u05」PQd
、,具有显著非零Pearson相关系数的的最小
值。A g