1 / 40
文档名称:

分析数据间的相关性.ppt

格式:ppt   大小:1,269KB   页数:40页
下载后只包含 1 个 PPT 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

分析数据间的相关性.ppt

上传人:小落意心冢 2022/6/26 文件大小:1.24 MB

下载得到文件列表

分析数据间的相关性.ppt

相关文档

文档介绍

文档介绍:分析数据间的相关性
第四章 分析数据间的相关性
世间万物总是存在不同程度的联系
函数关系
统计关系
线性相关
X
Y
正线性相关
负线性相关
X
Y
非线性相关
可能看起来像下图
我们可将这些数据看成平滑的分布
红线
75
80
60
65
70
55
Inches
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
正态曲线和概率
了解了正态曲线的平均值和标准偏差有助于估计风险
Probability of sample value
4
3
2
1
0
-
1
-
2
-
3
-
4
40%
30%
20%
10%
0%
Z-axis (scale in units of ‘s’)
Number of standard deviations from the mean
%
%
%
在两个值之间可以得到一個累積的概率值
正态分布的应用
4
3
2
1
0
-
1
-
2
-
3
-
4
40%
30%
20%
10%
0%
Probability of sample value
%
%
%
240
255
270
285
225
210
195
Time (minutes)
Z-axis
X-axis
如果我们货物交付给顾客的平均时间是240分钟,这一过程的标准偏差是15分钟,那么在270分钟后到货的概率为多少?
正态分布的应用2
中国成年男子身高均为168cm,:
1、身高小于160cm的概率。
2、身高高于180cm的概率。
3、身高介于160-180cm的概率。
假设检验的基本原理
显著性水平
显著性水平α是当原假设正确却被拒绝的概率

这表明,当做出接受原假设的决定时,其正确的可能性(概率)为95%或99%
(1)数值型数据相关的可靠性检验
数值型数据相关的可靠性检验步骤如下:
(1)首先提出两总体是否相关的假设,通常假设是两总体不相关。
(2)计算差距。计算当前相关系数与所提假设成立之间的差距。
(3)决策。若差距足够小,则当前的假设成立。若差距较大,说明提出的假设是站不住脚的。
统计中国,,,
相关系数的差距

TINV函数:TINV(probability,degrees_freedom), probability为1-把握程度; degrees_freedom为n-1
实践
个人购买商品住在面积与商品住宅销售额之间的相关性进行可靠性检验。
卡方分析的主要步骤:
(1)首先提出两总体是否相关的假设,通常假设行变量总体与列变量总体不相关。
(2)计算差距。计算目前列联表中的频数数据所呈现的实际相关性与行列变量总体不相关之间的差距有多少
(3)决策。若差距足够小,则当前的假设成立。若差距较大,说明提出的假设是站不住脚的。