1 / 25
文档名称:

SPSS for Windows 统计分析第二讲 相关分析与回归分析.docx

格式:docx   大小:77KB   页数:25页
下载后只包含 1 个 DOCX 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

SPSS for Windows 统计分析第二讲 相关分析与回归分析.docx

上传人:guoxiachuanyue005 2022/7/6 文件大小:77 KB

下载得到文件列表

SPSS for Windows 统计分析第二讲 相关分析与回归分析.docx

相关文档

文档介绍

文档介绍:第二讲相关分析与回归分析
第一节相关分析
1.1变量的相关性
1.变量的相关性分两种,一种是研究两个变量X与Y的相关
性,另一种是研究两组变量X^XyX与匕,Y2,…,Y之间的相关
12p12q性。本节只研究前者,
N
474
474
474
474
工作经验(月)
PearsonCorrelation
-.252**
-.097*
.045
1
Sig.(2-tailed)
.000
.034
.327
—N
474—
474—
474—
474—
-(2-tailed).
*■(2-tailed).
表格中的PearsonCorrelation指样本相关系数,;,起始薪金与受教育年限的相关性检验结果为Sig.=,,都能否定它们不相关的假设。N为观察值个数。
1.5偏相关系数
1•控制变量以上在计算变量X和Y的相关系数时,并没有考
虑有其他变量的影响。例如:计算当前薪金(salary)与起始薪金(salbegin),但是当前薪金显然还受到受教育年限(educ)的影响,这个影响在计算相关系数时没有被扣除,。如扣除educ的影响,在计算salary和salbegin的相关系数,就更接近真实了。这个被扣除的变量就叫控制变量,这里educ便是控制变量。控制变量可以不止一个。
2.偏相关系数扣除控制变量影响后得到的相关系数称为偏相
关系数(partialcorrelation),计算命令为:Correlate\Partial.
例2数据data02,计算当前薪金与起始薪金在扣除受教育年限影响后的偏相关系数。
在PartialCorrelations对话框中,将变量salary、salbegin输入Variables,将变量educ输入Controllingfor,然后|OK|,得:
Correlations
ControlVariables
当前薪金
起始薪金
受教育年限
当前薪金
Correlation

.795
Significanee(2-tailed)
.000
df
0
471
起始薪金
Correlation
.795

Significanee(2-tailed)
.000
df
471
0
其中Corrlation指偏相关系数,df自由度,Significance是对原假设H0:pCorr(X,Y)=0检验结果得到的水平值。可见:;不能接受不相关的假设。
第二节线性回归方程
2.1一元线性回归方程
“样板”,讨论变量X和Y的相关
程度,这一程度用相关系数表示。我们不禁要问:这个“样板”是什么?也就是把这个做“样板”的线性表达式:
Y=b+bX(1)
01
给出来,这也就相当于把系数b0和bi估计出来。这样,变量X和Y的关系就可以表示成为:
Y=b+bX+£=Y+8(2)
01
其中8为误差,是一个随机变量。显然,相关系数绝对值越大,误差8在表达式中占的比重就越小,也就是线性部分Y占的比重越大,这就有可能用线性表达式(1)近似表达变量X和Y的关系。称线性表达式(1)为变量Y对于X的(一元线性)回归方程
回归分析的主要任务是回答:
1)回归方程⑴能否近似代表变量X和Y的关系。这实际是对线
性部分与误差部分各占比重的估量;
2)怎样估计回归方程(1),也就是怎样估计参数b°和耳。显然,在任务2)完成前,任务1)无从开始。
2.回归的基本假设解决回归分析的主要任务还是要从样本:
(X,Y),i二1,2,...,n(3)
ii
入手。套用(2),样本(3)可以写成:
二b+bX+£,i二1,2,...,n(4)
i01ii
以下所有分析推导都从(4)出发。显然,需要用到一些数学方法。为此提出以下基本假设:
假设1E(£i)=0,i=1,2,...,n;
假设2Var(8i)=c2=const,i=1,2,...,n;
假设3Cov(8i,8j)=0,详j;
假设4气〜N(0,02),i=1,2,…,n。
、b』勺最小二乘估计
这一部分内容实际是估计回归方程。作为变量X和Y实际关