文档介绍:概率统计统计--相关分析
武汉纺织大学备课纸
补充教材:应用统计与计算(第一、二、七章)
张弛编著电大科技大学出版社教学目的
1、使学员掌握相关分析,一元、多元线性回归及曲线回归、因子分析等实用统计的基本概念、基本思想和计算方法,并能熟练应用它们解决教学、科研中的实际问题。
2、使学员牢固掌握运用SPSS统计软件作统计分析的技能。
第一章相关分析
一、相关的意义
由变量相依关系的特点,变量之间的依存关系可分为两大类型:
(1)确定性关系——函数关系,例如圆面积 S=πr2, y=ex+x2等。
(2)确定性关系——相关关系,例如人的血压y与年龄x之间的关系等。
以往我们讨论过的许多数学学科,如分析几何、代数等都是研究变量之间确定性关系的,但非确定性关系在自然界和我们熟知的教育领域中大量存在,例如学习成绩与智力因素或与非智力因素之间,数学成绩与物理成绩之间,性别与学习成绩之间等,都存在某种相互联系,相互制约的依存关系,这种关系不是那种严格的函数关系,而是一种非确定性的关系。相关关系和函数关系也有联系:由于观察和测量中会产生误差,函数关系往往通过相关关系表现出来,变量间相关关系非常密切时,通常又呈现出某种函数关系趋势。
二、相关的种类
按不同的分类标准,相关关系有多种分类
1、简单相关和复相关
简单相关——两个变量之间的相关关系
按涉及变量的多少分
复相关——一个变量与两个及以上个变量之间的相关关系
2、线性相关和非线性相关
线性相关(直线相关)
按变量关系的表现形态,相关关系可分为
非线性相关(曲线相关) 1
武汉纺织大学备课纸
3、正相关和负相关
按变量数值变化方向的总趋势,相关关系可分为正相关、负相关正相关——两个变量变化方向的趋势相同(见教材P2,图1-2左) 负相关——两个变量变化方向的趋势相反(见教材P2,图1-2右)
4、完全相关、高度相关、低度相关和不相关
按两变量联系的紧密程度分,相关关系可分为完全相关、高度相关、低度相关和不相关(零相关)(解释见教材P2-P3)。
三、相关分析的主要内容
研究两个或两个以上变量之间是否存在相关关系,如果存在相关关系,其相关的性质和程度如何,这个过程在统计学上称为相关分析,相关分析的主要内容包括:
1、确定变量之间有无相关关系存在,以及相关关系呈现的形态。
2、确定相关关系的密切程度。断送相关关系密切程度的主要方法是绘制散点图和计算相关系数。
3、对相关系数的显著性进行统计检验。
§ 积差相关系数及其显著性检验
一、积差相关系数(又称积矩相关系数),是20世纪初英国统计学家皮尔逊()提出的一种计算两个变量线性相关的系数,通常用r或rxy表示,它实际上是考察的两个变量y与x组成的二维随机向量(x、y)的样本相关系数。
若对(x、y)作了n次观测,得到n对数据(x1,y1)??,( xn,yn)。则定义r为:
r?Lxy
LxxLyy
xynnn其中:L??(xi?x)(yi?y),
i?1Lxx??(xi?x),Lyy??(yi?y)2, 2i?1i?1
x?1?xi,ni?1y?1?yini?1
由哥-席不等式易知|r|?1
根据我们已具备的概率知识,当|r|?1 时,可以认为x与y依pr为1存在完全的线 2
武汉纺织大学备课纸
性相关关系,|r|越小,x与y存在线性相关的程度越小,r=0 ,可以认为
x与y不相关(不存在线性相关),但不相关并不等于x与y相互独立,x与y之间可能存在其它形式的相关关系。在|r|≠0时,r>0,可认为x与y正相关,r>0,可认为x与y负相关。
二、积差相关系数的计算
当样本容量n不太大时,我们可用计算器计算积差相关系数,常用如下公式:
1Lxy??xiyi?(?xi)(?yi)??xiyi?nxyniiii
221Lxx??xi2?(?xi)??xi2?nxniii
221Lyy??yi2?(?yi)??yi2?nyniii
例1 教本P4-P5
计算rxy也可用统计软件SPSS,今后在上机实习中练习。
三、积差相关系数的显著性检验
设?表示x与y的总体相关系数,当?=0时,称x与y不相关,利用样本相关系数r可以检验H0: ?=0
当(x、y)为二元正态变量时,可以证明
t?rn?2
?r2 0~ t(n-2) (-6)
H真时利用该统计量检验H0的拒绝域为C={t | t |>tα} 这里t?为t(n-2)分布的分位数t
例2 (见教材P7) 1??2
例3 研究某校初三学生物理成绩y与