文档介绍:第四章分析数据间的相关性
世间万物总是存在不同程度的联系
函数关系
统计关系
例:正方形体积与边长,年龄与身高,父母身高与孩子身高,身高与体重,考试成绩与学习时间,学历与收入,收入与幸福感,物品价格与质量
线性相关
X
Y
正线性相关
负线性相关
X
Y
非线性相关
(1)图形分析法
散点图是统计关系分析中最常用的图形工具,它将数据以点的形式画在直角平面上,它将一组数据作为纵轴,将另一组数据作为纵轴,事物对象的每个个体以点的形式出现。
(1)若所有点落在一条直线上,说明数据间是线性相关,是函数关系,不是统计关系。
(2)所有点杂乱无章,从形态上看不出任何特征和规律,表明数据间不相关
(3)图形点大致呈某种曲线形态,表明数据间存在非线性相关
(4)所有点大致落在一条直线周围,表明数据间有线性相关性。
实践
1999年31个省市自治区个人购买商品住房住宅面积与商品住宅销售额的数据,现要求利用散点图法分析个人购买商品住房住宅面积与商品住宅销售额之间的相关性。
(2)数值分析法
图形能够直观展现数据间的相关关系,但并不精确。简单相关系数通过数字准确描述数据间线性相关的方向和强弱程度。
简单相关系数
简单相关系数取值范围[-1,1]
简单相关系数>0,表示两个数据正线性相关
简单相关系数<0,表示两个数据负线性相关
简单相关系数=0,表示两个数据不存在线性相关
简单相关系数>,表示两个数据相关性很强
简单相关系数<,表示两个数据相关性较弱
求简单相关系数的方法:
(1)简单相关系数可通过函数Correl或Pearson实现
(2)“数据分析”中相关系数命令