文档介绍:第六章相关与回归分析
江西财经大学统计学院
统计学
实践中的统计
消费者应该留下多少小费?
在西方国家餐饮等服务行业有一条不成文的规定,即发生餐饮等服务项目消费时,必须给服务员一定数额的小费,许多人都听说小费应该是账单的16%左右,是否真的如此呢?让我们来考察表10-1,表中的数据是经过调查所得的样本数据,通过对这几组数据的分析与观察,我们能发现两者之间的数量关系。
江西财经大学统计学院
统计学
问题是:
1、是否有足够的证据断定:在账单与小费数额之间存在某种联系?
2、如果存在某种联系,怎样使用这种联系来确定应该留下多少小费?
本章的重点就是基于成对出现的样本数据做出一些推论。如上例,我们想要确定账单与小费数额之间是否存在某种联系,如果存在,我们就想用一个公式描述它,这样就能找出人们留小费时遵循的规则。类似这样的问题还有很多,如:
(1)犯罪率与偷窃率;(2)香烟消费与患癌症率;
(3)个人收入水平与受教育年限;(4)血压与年龄;
(5)父母身高与子女身高;(6)薪金与酒价;
(7)人的手掌生命线的长度与人的寿命长短。
江西财经大学统计学院
统计学
实践中的统计
江西财经大学统计学院
统计学
相关分析与回归分析概述
相关分析与回归分析的内涵
(一) 变量间的相互关系
函数关系
定义:完全确定的(数量)关系。
(1)某一(组)变量与另一变量间存在着一一对应的关系;
[例]计件工资(y)与产量(x) y=f(x)=10x;
x0=1件, y0=10元; x1=2件, y1=20元
园的面积S=ΠR2,R=10,S=100 Π
(2)y被解释变量(因变量);x解释变量(自变量)。
相关关系
1、定义:不完全确定的依存关系。
(1)某一(组)变量与另一变量间有关系但并非一一对应;
相关分析与回归分析概述
江西财经大学统计学院
统计学
[例]身高y与体重x;
A:x=60kg、y=170m; B: x=60kg、y=;
C:x=60kg、y=; D: x=60kg、y=。
(2)表述:y=f(x)+。
影响身高的因素:体重、遗传、锻炼、睡眠质量……
2、成因
(1)某些影响因素尚未被认识;
(2)虽已认识但无法测量;
(3)测量误差。
[例]某种水果2元/斤: 购买额 y=2x 购买量
y=4元、x=2斤 y=2x+=2×+
3、数量关系的形式
江西财经大学统计学院
统计学
相关分析与回归分析概述
(1)单一因果关系;
(2)互为因果关系;
(3)伴随关系。
(二)、相关分析与回归分析
相关分析:用一个指标(相关系数),表明变量间相互依存关系的方向和密切程度。
回归分析:根据相关关系的形态,选择一个合适的数学模式,用来近似的表达变量间的平均变化关系。
y = a+bx 、 y=a+b1x1+bx2 、 y=0+ 1x1+ 2x2+…+ nxn
[回归]英国生物学家 F · Galton 首次提出。
父辈身高子辈身高
x y y = f(x)+:人类的平均身高。
江西财经大学统计学院
统计学
相关分析与回归分析概述
联系:①研究对象相同:均为相关关系
②相关分析是回归分析的基础,回归分析是相关分析的深入。
区别:①研究目的不同;相关分析:相关的方向和密切程度;
回归分析:相关的具体形式;
②研究方法不同;相关分析:指标
回归分析:数学模型
③对变量的要求不同;
相关分析:两个变量地位对等,都可为随机变量;
回归分析:右边的为自变量,左边的为因变量,并且要求自变量为非随机变量,因变量为随机变量。
两种分析方法的联系与区别:
江西财经大学统计学院
统计学
相关分析与回归分析概述
(一)相关关系的种类
1、按影响因素的多少分
(1)单(简)相关:只有一个自变量;
[例]学习成绩与学习时间;血压与年龄;亩产量与施肥量。
(2)复(多元)相关:两个或两个以上的自变量;
[例]经济增长与人口增长、科技水平、自然资源、管理水平等之间的关系;
体重与身高、食欲、睡眠时间之间的关系。
(3)偏相关:就多个变量测定其中两个变量的相关程度而假定其他变量不变。
[例]就y=ax1+bx2+ ,研究y与x1之间的关系,假定x2不变。
相关关系的种类及回归方程的类型
江西财经大学统计学院
统计学
相关分析与回归分析概述
2、按相关的程度分
(1)完全相关:函数关系;
(2)不相关:没有关系;
(3)不完全相关。
3、按相关的方向分
(1) 正相关:变量的变动方向一致(同增同减);
(2) 负相关:变量