1 / 7
文档名称:

r语言与回归分析.doc

格式:doc   大小:19KB   页数:7页
下载后只包含 1 个 DOC 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

r语言与回归分析.doc

上传人:wz_198614 2017/7/11 文件大小:19 KB

下载得到文件列表

r语言与回归分析.doc

文档介绍

文档介绍:R语言与回归分析
回归模型是计量里最基础也最常见的模型之一。究其原因,我想是因为在实际问题中我们并不知道总体分布如何,而且只有一组数据,那么试着对数据作回归分析将会是一个不错的选择。
一、简单线性回归
简单的线性回归涉及到两个变量:一个是解释变量,通常称为x;另一个是被解释变量,通常称为y。回归会用常见的最小二乘算法拟合线性模型:
yi = β0 + β1xi +εi
其中β0和β1是回归系数,εi表示误差。
在R中,你可以通过函数lm()去计算他。Lm()用法如下: lm(formula, data, subset, weights, ,
method = "qr", model = TRUE, x = FALSE, y = FALSE, qr = TRUE, = TRUE, contrasts = NULL, offset, ...)
参数是formula模型公式,例如y ~ x。公式中波浪号(~)左侧的是响应变量,右侧是预测变量。函数会估计回归系数β0和β1,分别以截距(intercept)和x的系数表示。
有三种方式可以实现最小二乘法的简单线性回归,假设数据wage1(可以通过names函数查看数据框各项名称)
(1)lm(wage1$wage ~ wage1$educ + wage1$exper)
(2)lm (wage ~ educ + exper, data= wage1)
(3)attach(wage1)
lm(wage~educ+exper)#不要忘记处理完后用detach()解出关联
我们以数据wage1为例,可以看到工资与教育水平的线性关系: 运行下列代码:
library(foreign)
A<-("D:/R/data/")#导入数据
lm(wage~educ,data=A)
>lm(wage~educ,data=A)
Call:
lm(formula = wage~ educ, data = A)
Coefficients:
(Intercept) educ
-
当然得到这些数据是不够的,我们必须要有足够的证据去证明我们所做的回归的合理性。那么如何获取回归的信息呢?
尝试运行以下代码:
result<-lm(wage~educ,data=A)
summary(result)
我们可以得到以下结果:
Call:
lm(formula = wage~ educ, data = A)
Residuals:
Min 1Q Median 3Q Max
- - -
Coefficients:
Estimate t value Pr(>|t|)
(Intercept) - -
educ <2e-16 ***
---
: 0 ‘***’ ‘*