文档介绍:(因变量)与身高(自变量、定量变量)的关系时,一般需要把男女学生分开来考虑,因为这一关系很可能因为性别的不同而不同。。如果分别考虑男、女生的体重与身高的关系,并假设这一关系为线性的,我们得到(拟合)如下两个简单线性回归方程,括号内为相应系数估计的p-值。女生: w0=-+,R2=, (.547) (.002) F=(.002)男生: w1=-+,R2=, (.032) (.000) F=(.000)拟合结果表明,男、女生的身高和体重的关系是不同的。问题是:上述身高和体重的关系在不同性别之间的差异显著吗?在上述结果中似乎没有一个合适的量来回答这一问题。在回归模型中引进哑变量(dummyvariable),我们就可以来回答上述问题。哑变量的取值为1和0,用来区分定性变量取某个特定值还是其它值。例1中的变量D就是一个哑变量,哑变量的应用——例1的带有哑变量的回归模型为如下的多元线性回归模型:(变量Dh=D×h)w=b0+b1D+b2h+b3(Dh)+e (1)对于女生,D=0,模型(1)变为w=b0+b2h+e;而男生的模型则为w=(b0+b1)+(b2+b3)h+e。拟合得到如下的回归方程:w=-–++ (.534)(.347)(.001)(.166)由拟合结果可以看出,变量D和Dh的系数均不显著。因此可以说,性别对身高和体重关系的影响不显著。但是,由于b0不显著,因此我们需对模型作修改:w=–++ (.033)(.000)(.004)此时,变量D和Dh的系数均为显著的。因此我们说,性别对身高和体重关系的影响是显著的。w=–++=0w==1w=–+(+)h男生身高对体重的效应大于女生身高对体重的效应4二项Logistic回归例子在一次住房展销会上,与房地产商签定购房意向书的顾客中,在随后3个月中,,没有购买记为0一、定性因变量的回归方程的意义设因变量y只是取0,1两个值的定性变量,考虑简单线性回归模型:由于,是0—1型贝努利随机变量,则得如下分布根据随机变量的期望值定义,可得二、—1型因变量产生的问题,对回归模型应该作两个方面的改进。,而不能再沿用直线回归方程。,1两个离散值,不适于直接作为回归模型中的因变量,可以用等于1的比例代替本身作为因变量。