1 / 9
文档名称:

相关系数与P值的一些基本概念.docx

格式:docx   大小:186KB   页数:9页
下载后只包含 1 个 DOCX 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

相关系数与P值的一些基本概念.docx

上传人:guoxiachuanyue 2022/10/4 文件大小:186 KB

下载得到文件列表

相关系数与P值的一些基本概念.docx

相关文档

文档介绍

文档介绍:该【相关系数与P值的一些基本概念 】是由【guoxiachuanyue】上传分享,文档一共【9】页,该文档可以免费在线阅读,需要了解更多关于【相关系数与P值的一些基本概念 】的内容,可以使用淘豆网的站内搜索功能,选择自己适合的文档,以下文字是截取该文章内的部分文字,如需要获得完整电子版,请下载此文档到您的设备,方便您编辑和打印。相关系数与P值的一些基本概念
注:在期末论文写作过程中,关于相关系数与假设检验结果的表达方式,出现了一些概念问题。这篇文档的内容是对一些相关资料进行整理后的结果,供感兴趣的同学参考。如果需要更确切的定义,请进一步参阅统计分析类的教材。

常用Pearson'scorrelationcoeff计算e公式与传统概念上的相同,即:
cov(x?Y)E[(X—啟)(”—“)]
PX^Y二=
常用符号r表示。-lWrWl
如果用于评估数据点与拟合曲线间的关联程度,则一般用相关系数的平方值表示,常用符号为R2,0<R2<1
典型示例如下图。R2相差不大,但显然数据规律完全不同。因此,一般需要结合拟合
曲线图表给出R2,才有参考价值。
Xi
相关系数另一方面的应用是用来评估两组数据之间相互关联的程度,简单来说,就是判断一下两参量之间是否“相关”,有3种可能的情况,如下面的图所示。
(1)r>0,正相关。x增大,y倾向于增大;
⑵r<0,负相关。x增大,y倾向于减小;
⑶r=0,不相关。x增大,y变化无倾向性;
Negativecorrelation
Nocorrelation
Positivecorrelation
*
*
*
*
*
*
[.叫
*
*
*
*
Id
*
**
**
此时的相关系数一般用r表示。下图给出了不同r取值的例子。
*-070
*-~比*
于r-
显然,如果只是用来判断两参量之间的“关联”性质,r=-=。
所以也可用(常见)r的绝对值表达。用文字表述“关联”程度时,可参考下面的取值范围
建议:
.00-.19"veryweak"
.20-.39^weak''
.40-.59^moderate
.60-.79"strong"
.80-'Verystrong1
需要注意的是,这种相关系数的计算方法给出的r值,实际上反映的是“线性相关”的
程度,如果两者虽然相关,但不是线性的,很可能给出不是很靠得住的结果,观察下面的例子。
7=0r=-.45r=.92
-1U
-
X
Spearmancorrelational
-.aPear£OncorrelatiDn=0'sa
左下角图中,两参量显然相关,但“线性”程度不够,所以Pearson'scorrelationcoefficient

另外一种相关系数的计算方法,Spearmancorrelationcoefficient,用来评估两参量之间的“单调相关性”。如上面左下角图中的Spearman相关系数=1。Spearmancorrelationcoefficient计算公式为:
P1/2-|\■
?i(nz—1)
其中,n为样本数,爪一:
面的图是一些例子:
(p-values)
P值是配对t检验(pairedt-test)计算过程中得到的结果。用来评估前面所述相关程度计算结果的“显著程度”在常用统计软件SPSS中,P值(p-value,有时显示为Sig-value)的计算是建立在如下两个假设基础上的:
无效假设(nullhypothesis)H。:r=0,两参量间不存在“线性”关联。
备择假设(alternativehypothesis)气:r工0,两参量间存在“线性”关联。如果计算出的P值很小,,则可说“有非常显著的证据拒绝H0假设,相信
H1假设,即两参量间存在显著的线性关联”
P值的数值大小没有统计意义,只是将其与某一个阈值进行比对,以得到二选一的结论。关于P值的判断阈值,可参照下面给出的建议:
p>
<p<
<p<
p<
(5%)。因此判断规则如下:
,拒绝无效假设,接受备择假设,即“存在显著的线性关联”
P>,拒绝无效假设失败。
上面所给出的判断方式中,确切的结论是以'PW阈值”为标准的,如果不是这样,而是“p〉阈值”,则只能给出检验失败的结论,不能说“接受无效假设”从而得出
“存在显著线性关联”的结论。
P值只用于二值化判断,因此不能说P值=“更好”为更好地理解,下面给出例子。
Hb
两参量Hb、PCV,经SPSS软件计算得到如下结果:
Correlations
Hb
PGV
Hb
P旱吕「乍onGarr^latiQn
1
A1T'
Sig.(2-toiled)
.000
N
14
u
PCV
PearsdnCcirrelatitiri
1
SigJZ-tailed)
.ooc
N
14
14
**.Carrelati-onissignificantatthe€.01level(2tailed).
结论可表达为;“对于所采集到的14个样本值,计算了两参量Hb、PCV之间的Pearson
相关系数,两参量之间存在显著正相关(r=,N=14,)”。
需要注意的是,相关程度未必能够代表两参量之间存在因果关系。比如上面的例子,只能说明Hb、PCV之间存在关联,而不是“Hb导致PCV变化”。
这种统计分析的结论,与具体的实验设计方式关系很大,需要特别关注是否存在一些隐藏在数据背后的因素。下面是一个极端一些的例子,分析儿童足底长度(footlength)与阅
读能力(readingability)之间的关系。
用SPSS计算,可得到足底长度与阅读能力之间“显著相关”的结果
(r=,N=54,p=)。然而,如果考虑到年龄,则可发现这种“显著相关”很可能是靠不住的,如下图。
左昌q<BU亠PBdlrr
面的图是分年龄的统计结果。可以看到,无法得到“显著相关”的结论。
Age(years)=8
心In■■叫:■
a
l^xraUHiDffis*
H-i^EiidtongAbilityGQrr^Lg.*|iQrt
Sig.(2-tailed)
FootC-ejigei
Feare&nCorr«-bUqu
Siy.(2-1ailad)
FiWll”ri日Uh
Age(years)=10
j*
Ikngtti
Zl
Age(years)=12
-I'^nrs)-B
Reading
Adjjy
210
.4D3
.210
403
IRn-iinng舷lli話
Fooiienpfi
RuadihgAbility
1
-.46S
Sig.(2iftihd)
.0M
N
IT
17
FbMlength
Ppgjrstxi罰二凹
-.465
1
Sig.(Mailed)
.060
N
17
17
Cwrebllans1'
aAqe讷ars)=10
ReadingAhitv
Footl<J!iq?i
RvB'dirTgAbility
Pq预間御硏口冲巾力。"
1
-2S0
Sig.(S-iallKl)
.22B
N
19
19
Foollen^ih
Pears-otfiCorreailon
-.2^0
1
Sig.(Z-lalled)
22fi
N
19

CnirrAht^n^*
■12