文档介绍:第八章成对数据的统计分析
§ 成对数据的统计相关性
【学习目标1•结合实例,了解样本相关系数的统计含义2了解样本相关系数与标准化数据向 ,会通过样本相关系数比较多组成对样本数据的相关性. 知识tst理 抜C. y=x+1 D. y=—x2
答案 A
解析•・•这组成对样本数据的样本相关系数为一1,
这一组成对样本数据(x1,y1), (x2,y2),…,(xn,y”)线性相关,且是负相关.
・•・可排除B,C,D,故选A.
反思感悟 样本相关系数的性质
r 的绝对值越接近 0,相关性越弱.
r 的绝对值越接近 1,相关性越强.
u, v有成对样本数据(叫,v.)(z = 1,2,-, 10),得散点图图2•由这两个散点图可以判断()
O ] 2 3 4 S 6 7 r 图1
[毗
变量x与y正相关,
变量x与y正相关,
变量x与y负相关,
变量x与y负相关,
u与v正相关
u与v负相关
u与v正相关
u与v负相关
答案 C
解析 由这两个散点图可以判断,变量x与y负相关,u与v正相关.
(2)(多选)对两个变量的样本相关系数r,下列说法正确的是()
Irl越大,相关程度越大
Irl越小,相关程度越大
Irl趋近于0时,没有线性相关关系
Irl越接近1时,线性相关程度越强
答案 AD
解析对于A, Irl越大,相关程度越大,A正确;对于B, Irl越小,相关程度越小,B错误; 对于C,Irl趋近于0时,线性相关关系越弱,C错误;对于D,Irl越接近1时,线性相关程度 越强,,正确的是AD.
三、样本相关系数的计算及应用
例3某厂的生产原料耗费x(单位:百万元)与销售额y(单位:百万元)之间有如下的对应关系:
x
2
4
6
8
y
30
40
50
70
画出(x, y)的散点图;
计算x与y之间的样本相关系数,并刻画它们的相关程度. 解(1)画出(x, y)的散点图如图所示.
⑵ x =5, y =,
£x2=120, £y2=9 900, £.= l 080,
i i i i
i= 1 i= 1 i= 1
^.—4 x y
故样本相关系数r= ==
(£x?—4 x 2)(£^—4 y 2)
i=1 i=1
1 080—
= 7.
\;(120—4X52)(9 900—)
由样本相关系数r~ 7,可以推断生产原料耗费与销售额这两个变量正线性相关,且相
关程度很高.
反思感悟 线性相关强弱的判断方法 (1)散点图:散点图只是粗略作出判断,其图象越接近直线,相关性越强.
(2)样本相关系数:样本相关系数能够较准确的判断相关的程度,其绝对值越大,相关性越强.
x
2
3
4
5
6
y
计算y与x之间的样本相关系数(,已知tx2=90,, .= ,'79
i=1 i=1 i=1
,近 ).
2+3+4+5+6
++++
y = 5 =系 . (填“是”或“否”)
・
.—5 x y =—5X4X5 = ,
.=1
tx2—5 x 2=90—5X42=10,
.
ty?—5 J 2= — 125 = ,
£.—5 x y
i=1
.r= ・
n no
- - 莎二/2g79~~°.987.
(2x2—5 x 2)(Xy2—5 y 2)
i=1 i=1
随堂演练 趾枫因学以致用 1 . (多选 )下列命题正确的是( )
任意两个变量都具有相关关系
圆的周长与该圆的直径具有相关关系
某商品的需求量与该商品的价格是一种非确定性关系
当两个变量相关且样本相关系数r>0时,表明两个变量正相关
答案 CD
解析 A显然不对,B是函数关系,CD正确.
若变量y与x之间的样本相关系数r=— 2,则变量y与x之间()
不具有线性相关关系
具有线性相关关系
它们的线性相关关系还需要进一步确定
不确定
答案 B
解析 变量y与x之间的样本相关系数r=— 2, lrl = 2接近1,样本相关系数的绝 对值越大,相关性越强,.••变量y与x之间有较强的线性相关关系,故选B.
两个变量x, y的样本相关系数r1 = 9