1 / 11
文档名称:

STATA指南第六讲.doc

格式:doc   大小:128KB   页数:11页
下载后只包含 1 个 DOC 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

STATA指南第六讲.doc

上传人:buhouhui915 2018/4/25 文件大小:128 KB

下载得到文件列表

STATA指南第六讲.doc

相关文档

文档介绍

文档介绍:线性相关和回归
赵耐青
在实际研究中,经常要考察两个指标之间的关系,即:相关性。现以体重与身高的关系为例,分析两个变量之间的相关性。要求身高和体重呈双正态分布,既:在身高和体重平均数的附近的频数较多,远离身高和体重平均数的频数较少。
样本相关系数计算公式(称为Pearson相关系数):
(1)
考察随机模拟相关的情况。
(本教材配套程序,使用见前言)。命令为simur 样本量总体相关系数
如显示样本量为100,r=0的散点图
本例命令为simur 100 0
如显示样本量为200,r=
本例命令为simur 200
如显示样本量为200,r=
本例命令为simur 200
如显示样本量为200,r=-
本例命令为simur 200 -
例1. 测得某地15名正常成年男子的身高x(cm)、体重y(kg)如试计算x和y之间的相关系数r并检验H0:r=0 vs H1: r¹0。
a=
数据格式为
X
Y






























Stata命令 pwcorr 变量1 变量2 …变量m,sig
本例命令 pwcorr x y,sig
pwcorr x y,sig
| x y
-------------+------------------
x |
|
|
y |
|
|
Pearson相关系数=,P值=<,因此可以认为身高与体重呈正线性相关。
注意:Pearson相关系数又称为线性相关系数并且要求X和Y双正态分布,通常在检查中要求X服从正态分布并且Y服从正态分布。
如果不满足双正态分布时,可以计算Spearman相关系数又称为非参数相关系数。
Spearman相关系数的计算基本思想为:用X和Y的秩代替它们的原始数据,然后代入Pearson相关系数的计算公式并且检验与Pearson相关系数类同。
Stata实现
spearman x y
Number of obs = 15
Spearman's rho =
Test of Ho: x and y are independent
Prob > |t| =
stata计算结果与手算的结果一致。结论为身高与体重呈正相关,并且有统计学意义。
直线回归
例2 为了研究3岁至8岁男孩身高与年龄的规律,在某地区在3岁至8岁男孩中随机抽样,共分6个年龄层抽样:3岁,4岁,…,8岁,每个层抽10个男孩,共抽60个男孩。资料如下:
60个男孩的身高资料如下
年龄
3岁
4岁
5岁
6岁
7岁
8岁






























































平均身高






由于男孩的身高与年龄有关系,不同的年龄组的平均身高是不同的,由平均身高与年龄作图可以发现:年龄与平均身高的点在一条直线附近。
考虑到样本均数存在抽样误差,故有理由认为身高的总体均数与年龄的关系可能是一条直线关系,其中y表示身高,x表示年龄。由于身高的总体均数与年龄有关,所以更正确地标记应为