文档介绍:内容:基本概念
古典回归分析
施肥模型的回归设计
第四章 回归分析
一、变量之间的关系
1 、函数关系 (确定性关系)
指当其中一个变量(自变量)在其变化范围内取定某一数值时S总=Lyy=∑(ya- Ӯ)2=∑[(ya- ŷa)+( ŷa- Ӯ)]2
=∑(ya- ŷa)2+∑( ŷa- Ӯ)2+2∑(ya- ŷa)( ŷa- Ӯ)
=∑(ya- ŷa)2+∑( ŷa- Ӯ)2
这是因为2∑(ya- ŷa)( ŷa- Ӯ)=0。 证明在课本P239
2、自由度的确定
在回归方程的方差分析中,总平方和为y的平方和,故总自由度应为y的自由度,即dfT=N-1,N为观察值ya的个数。设K为包括b0在内回归系数的个数,则
总自由度dfT可作如下分解:
dfT=(K-1)+(N-K)。
其中(K-1)为回归自由度,记做dfu=2-1=1,(N-K)为剩余自由度记做dfQ=N-2。
3 F检验
直线回归方程的显著性检验,就是检验Y与x之间是否有线性关系,实质上就是检验回归系数是否为0。
因此,无效假设为H0: β=0,即y与x无线性关系;对应假设为HA:β≠0,即y与x之间有线性关系;检验所用统计量F为:
F=Su2/SQ2
=u/Q/(N-2)
F值计算出来后,与附表中相应F值相比较,(其可信程度为95%),,表示所建立的回归直线方程是极显著的,其可信程度为99%以上。
(四)、 利用回归方程进行预报和控制
建立回归方程的目的之一是为通过自变量来预测因变量y,就是对y的条件平均数µ。
当回归方程通过检验并拟合得好时,就可利用它进行y的区间估计。
当x为某一给定值xa时,根据回归方程可得回归值ŷ=b0+bxa,
对条件平均数µ:
其中Se2剩余方差。
y的条件平均数µ:
ŷa-taSŷ≤µ≤ŷa+taSŷ
(2)对y的个体值进行区间估计的估测标准误差Sŷ为:
y个体值的置信区间为:
ŷa-taSy≤µ≤ŷa+taSy
应该指出的是:根据回归方程对y进行区间估计,自变量x的取值必须在实验数据x值的全距内才为有效,不能随意外推。
(五)、计算实例
为了探讨土壤速效磷含量与产量之间的关系,在马江娄图上选择了20个地块种植小麦,品种为小偃六号,,播前采取土样,用Olsen法测定土壤速效磷含量,试验结果间下表,试作回归分析。
地块号 速效磷 小麦产量
(µ-1) (kg/)
地块号 速效磷 小麦产量
(µ-1) (kg/)
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
(1)、根据试验数据,先做散点图,从图判断该配置的方程模型。
小麦产量是随着土壤速效磷含量的增增加而增加,它们之间大致成直线关系,这就是说x和y的关系可以基本上看作是直线关系,可按直线配置回归方程。
本题基础数据结果如下:
∑x = ∑y=
∑xy= n=20
=