文档介绍:第九章
双变量回归与相关
Bivariate
Regression & Correlation
第2、第3、第4章介绍计量资料单变量统计分布特征或比较该变量的组间差别:
例2-1 计算101名成年女子血清总胆固醇的平均指标与变异指标。
例3-7 比较阿卡波糖(试验组)与拜糖苹(对照组)降低糖尿病人的空腹血糖值有无差别。
例4-2 比较安慰剂组、、、。
在医学研究中常要分析变量间的关系:如年龄与血压,药物剂量与动物死亡率,肺活量与体重、胸围和肩宽等指标的关系。
第一节直线回归
一、直线回归的概念
“回归”是一个借用已久因而相沿成习的统计学术语。返回原来的地方。
生物遗传学上的“回归”:英国统计学家Pearson K(1857~1936)1903年搜集了1078个家庭人员的身高、前臂长等指标的记录,发现儿子身高(Y,英寸)与父亲身高(X,英寸)存在线形关系: =+ X ,即高个子父代的子一
代在成年之后的身高平均来说不是比其父代更高,而是稍矮于其父代水平;而矮个子父代的子一代,成年之后的身高平均来说不是比其父代更矮,而是稍高于其父代水平。英国生物遗传学和统计学家Galton F(1822~1911)将这种趋向于种族稳定的现象称之为“回归”。
天文学上的“回归”:地球绕太阳公转,在公转的同时,本身还自转,本身自转的同时,地球的轴心(假设)还来回摆动,由于地球轴心的来回摆
动,太阳光垂直照射到地球上就有南、北两个极限位置(南、北纬度23027’),分别称为南、北回归线,分别为我国农历的冬至与夏至。以上现象称为太阳光对赤道的“回归”。
日常生活中的“回归”现象:穿军装…;智商高或低的父代与子代…;1岁姜二狗,7岁姜二狗同学,20岁小姜同志,30岁姜科长,40岁姜处长,50岁姜老,60岁老姜;70岁姜二狗。
目前“回归”已成为表示变量之间某种数量关系的统计术语,并且衍生出“回归方程”、“回归系数”等统计学概念。
年龄(岁)X
尿肌酐含量
Y
(mmol/24h)
y
x
二、直线回归方程的求法