文档介绍:回归分析模型
回归的概念
随机变量与变量(它可能是多维向量)之间的关系,当自变量确定
之后,因变量的值并不随着确定,而是按一定的统计规律(即随机变量的分布)取值,这时我们将他们之间的关系表示为
其中是一个确定的函数,称之为回归函数,
为随机项,且服从
2、回归分析的主要任务之一是确定回归函数,当是一元线性函数时,称之为一元线性回归,当是多元线性函数时,称之为多元线性回归,当是非线性函数时,称之为非线性回归。
3、一元线性回归:设
取定一组不完全相同的值,作独立实验得到对观察结果
其中,是处对随机变量观察的结果。
将数据点代入,有
回归分析的首要任务是通过观察结果来确定回归系数的估计,一般情况下用最小二乘法确定回归直线方程: 中的未知参数,使回归直线与所有数据点都比较接近。即要使残差和或最小。其中
4、化为一元回归
在某些非线性回归方程中,为了确定其中的未知参数,往往可以通过变量代换,把非线性回归化为线性回归,然后用线性回归的方法确定这些参数。下表列出了常用的可线性化回归曲线方程。
曲线方程
变换公式
变换后的线性方程
5、问题:下表是1957年美国旧轿车价格的调查资料,今以表示轿车的使用年数,表示相应的平均价格,试根据这些数据建立一个数学模型,分析旧轿车的平均价格与旧轿车的使用年数之间的关系(实际上是求关于的回归方程)。
()
使用年数
1
2
3
4
5
6
7
8
9
10
平均价格
2651
1943
1494
1087
765
538
484
290
226
204
解:作散点图:
x=1:10;
y=[2651,1943,1494,1087,765,538,484,290,226,204];
for i=1:10
plot(x(i),y(i),'ok');
hold on
end
%xlabel('x');
%ylabel('y');
看起来与呈指数相关关系,于是令
记,并做的散点图,
x=1:10;
y=[2651,1943,1494,1087,765,538,48