文档介绍:第八章回归分析方法
当人们对研究对象的内在特性和各因素间的关系有比较充分的认识时,一般用机理分析方法建立数学模型。如果由于客观事物内部规律的复杂性及人们认识程度的限制,无法分析实际对象内在的因果关系,建立合乎机理规律的数学模型,那么通常的布大于F值的概率p;剩余方差s2的值()。s2也可由程序sum()/(n-2)计算。
其意义和用法如下:R2的值越接近1,变量的线性相关性越强,说明模型有效;如果满足
F(1,n-2)<F,则认为变量y与x显着地有线性关系,其中F(1,n-2)的值可查f分布表,或直接1—1—
用MATLAB命令finv(1-«,1,n-2)计算得到;如果P表示线性模型可用。这三个值可以相互印证。s2的
值主要用来比较模型是否有改进,其值越小说明模型精度越高。
例1测得16名成年女子身高y与腿长x所得数据如下:
表8-116名女子身高(cm)腿长(cm)数据
8885
88
91929393959698
97
96
98
99
100
102
143145
146
147149150153154155156
157
158
159
160
162
164
首先利用命令plot(x,y,'r*')画出散点图,从图形可以看出,这些点大致分布在一条直线的左右,因此,可以考虑一元线性回归。可编制程序如下:
y=[143145146147149150153154155156157158159160162164];
x=[8885889192939395969897969899100102];
n=16;
X=[ones(n,1),x'];
[b,bint,r,rint,s]=regress(y',X,);
b,bint,s,
rcoplot(r,rint)
运行后得到
b=
bint=
s=
R2=,由finv(,1,14)=,即F(1,n-2)==,,
1—a
可以通过残差图发现,第二个数据为奇异数据,去掉该数据后运行后得到
b=
bint=-
s=
R2=,由finv(,1,13)=,即F(1,n-2)=<F=,p<,说明模型有效且
1—a
有改进,+。
当然,也可以利用直线拟合得到同一方程。只不过不能得到参数置信区间和对模型进行检验。拟合程序如下:
y二[143145146147149150153154155156157158159160162164];
x=[8885889192939395969897969899100102];
a二polyfit(x,y,1)
temp二polyval(a,x);
plot(x,y,'r*',x,temp)
注意:函数相同,但输出一次函数参数顺序与回归分析(升幕排列)中不同。另一个差别是拟合不能发现奇异数据。
如果根据经验和有关知识认为与因变量有关联的自变量不止一个,那么就应该考虑用最小二乘准则建立多元线性回归模型。
设影响因变量y的主要因素(自变量)有m个,记x=(x,,x),假设它们有如下的线性关系式:
1m
y=卩+卩x++卩x+£,…£〜N(0cp)
011mm
如果对变量y与自变量x,x,,x同时作n次观察(n>m)得n组观察值,采用最小二乘估计求得回
12m
归方程…
y=0+0x++0x.
011km
建立回归模型是一个相当复杂的过程,概括起来主要有以下几个方面工作(1)根据研究目的收集数据和预分析;(2)根据散点图是否具有线性关系建立基本回归模型;(3)模型的精细分析;(4)模型的确认与应用等。
收集数据的一个经验准则是收集的数据量(样本容量)至少应为可能的自变量数目的6~10倍。在建模过程中首先要根据所研究问题的目的设置因变量,然后再选取与该因变量有统计关系的一些变量作为自变量。我们当然希望选择与问题关系密切的变量,同时这些变量之间相关性不太强,这可以在得到初步的模型后利用MATLAB软件进行相关性检验。下面通过一个案例探讨MA