文档介绍:CreateByYelky
CreateByYelky
一元线性回归分析
1一元回归分析
在进行回归分析时,我们必需知道或假定在两个随机之间存在着一定的关系。这种关系可以用Y的函数的形式表示出来,即Y是所谓的因变量,它仅仅依
68
4624
工234
10144
n二9,X二234二26,
99
£(x-x)=4060
i
i=1
£(y-y)=
i
i=1
£(x—X)(y—y)=
ii
i=1
工(x-x)(y-y)
b=——二=35348=(x-x)24060
i
CreateByYelky
CreateByYelky
i=1
a=y-bx=
用Minitab求得的结果如下:
a
因此所求的回归直线方程为
y=+
参数估计量的分布
为了对前面所作的y与x是线性关系的假设的合理性进行检验,为了求出预测值的置信区间,我们必须知道所估计的参数的分布。
1)・b的分布:
工(x-x)(y-y)
由于b=亠Ji—
丫(x-x)2
i
i=1
按假定,y,y,…y相互独立,而且已知y〜N(a+bx,a2),其中x为
12ni
常数,所以由b的表达式知b为独立正态变量y,y,…y的线性组合,
12n
CreateByYelky
CreateByYelky
于是b也是正态随机变量。可以证明b〜N(b,a2/工(X-x)2)
i
i=1
另外,对于任意给定的X=X,其对应的回归值y=a+bx,由于000
a=y-bx,所以可以写成,
八八
y=a+bx=y+b(x-X)
000
也就是说,在x=x处y所对应的估计值也是一个正态分布的随0
机变量,可以证明,
y〜N(a+bx,
00
1(x—x)2
+0—
n£(x—x)2i
i=1
a2)
CreateByYelky
CreateByYelky
CreateByYelky
CreateByYelky
2)•方差o2的估计:
为了估计方差,考查各个x处的y与其相对应的回归值
ii
y=y+b(x—x)与其离差y—y的平方和SSD:
iiii
SSD=£(y—y)2
ii
i=1
可以证明,其期望值为,
E(SSD)=(n—2)a2
因此,E(SSD)/(n-2)是a2的无偏估计,即,
SSD
(n—2)
1
(n—2)
£(y—y)2
i
i=1
CreateByYelky
CreateByYelky
CreateByYelky
CreateByYelky
而且,其自由度为n-2,其分布为,
(n—2)a2
a2
SSD
a2
〜X2(n—2)
CreateByYelky
CreateByYelky
线性假设的显著性检验
现在来检验y二a+bx+£,E〜N(OQ2)这一线性假设是否合适,这也就是检验假设,
H:b=0H:b丰0
01
由于
设X〜N(0,1),Y〜x2(n),并且X与Y相互独立,则随机变量
t=X服从自由度为n的t(student)分布,记为t〜t(n)。v'Y/n
因此从上面的结果可以得知统计量,
b—b/伫〜t(n-2)(5)
Q2F◎2
(x-x)2
i=1
即,
因为在假设H下b=0,所以,在此假设下,
0
2乞(x—x)2〜t(n—2)
八i=「
由此可得,如果,
b|厂
—,i^(x—x)2>tz(n—2),
QIa2
1i=12
b
t=—
s
b
或写成,
>t(n—2)a
2
其中s-_b
CreateByYelky
CreateByYelky
bI目(X-X)2
则在显著水平a下拒绝假设h:b二0,认为回归效果是显著的,0
也就是说y与x之间存在着线性关系y二a+bx+£;若上述不等式反号,
就认为回归效果不显著,回归效果不显著的原因可能有以下几种:
a)影响y的除x外,还有其它不可忽略的因素;
b)y与x的关系不是线性的,而是存在着其他的关系;
c)y与x无关。
因此,在这样的情况下,要查明原因,分别处理。
例3:检验例2的回归效果是否显著。取a=。
解:因为n=9所以
(x-X)2=bl
n-2y(_、
乙(X-X)2y(y.-y)2日