文档介绍:R语言和回归分析回归模型是计量里最基础也最常见模型之一。究其原因,我想是因为在实际问题中我们并不知道总体分布怎样,而且只有一组数据,那么试着对数据作回归分析将会是一个不错选择。一、简单线性回归   简单线性回归包含到两个变量:一个是解释变量,通常称为x;另一个是被解释变量,通常称为y。回归会用常见最小二乘算法拟合线性模型:yi=β0+β1xi+εi其中β0和β1是回归系数,εi表示误差。在R中,你能够经过函数lm()去计算她。Lm()使用方法以下:lm(formula,data,subset,weights,,  method="qr",model=TRUE,x=FALSE,y=FALSE,qr=TRUE,  =TRUE,contrasts=NULL,offset,...)    参数是formula模型公式,比如y~x。公式中波浪号(~)左侧是响应变量,右侧是估计变量。函数会估量回归系数β0和β1,分别以截距(intercept)和x系数表示。   有三种方法能够实现最小二乘法简单线性回归,假设数据wage1(能够经过names函数查看数据框各项名称)(1)lm(wage1$wage~wage1$educ+wage1$exper)(2)lm(wage~educ+exper,data=wage1)(3)attach(wage1)   lm(wage~educ+exper)#不要忘记处理完后用detach()解出关联     我们以数据wage1为例,能够看到工资和教育水平线性关系:运行下列代码:library(foreign)A<-("D:/R/data/")#导入数据lm(wage~educ,data=A)>lm(wage~educ,data=A)Call:lm(formula=wage~educ,data=A)Coefficients:(Intercept)        educ -            当然得到这些数据是不够,我们必需要有足够证据去证实我们所做回归合理性。那么怎样获取回归信息呢?     尝试运行以下代码:result<-lm(wage~educ,data=A)summary(result)我们能够得到以下结果:Call:lm(formula=wage~educ,data=A)Residuals:   Min     1Q    Median     3Q    Max-  -   -       :           Estimate     tvalue Pr(>|t|)   (Intercept)  -     -      educ              <2e-16***---: 0‘***’‘**’‘*’‘.’‘’1Residualstandarderror:-squared:,