文档介绍:第7章回归分析
返回
变量间的关系
确定性关系或函数关系y=f(x)
人的身高和体重
家庭的收入和消费
商品的广告费和销售额
粮食的产量和施肥量
股票的价格和时间
学生的期中和期末考试成绩,…
非确定性关系
如果对于任何已知的x值,变量y和按某个概率取某些特殊的值,则x和y之间的关系为随机的.
x
Y
实变量
随机变量
非确定性关系
(x,y)
采集样本信息(xi,yi)
回归分析
散点图
回归方程
回归方程的显著性检验
对现实进行预测与控制
基本思想
如果数学关系式描写了一个变量与另一个变量之间的关系,则称其为一元回归分析;
如果数学关系式描写了一个变量与另多个变量之间的关系,则称其为多元回归分析,并且称这一个变量是被影响变量(因变量:Dependent Variable);
称这多个变量是影响变量(自变量:Independent Variable).
回归分析是根据变量观测数据分析变量间关系的常用统计分析方法.
通常把变量观测数据称为样本.
某市场在t时刻黄瓜销量的数据如下(其中qt表示t时刻销售黄瓜的数量,单位为:斤,pt表示t时刻的销售价格,单位为:元):
这是一个确定性关系:
例如
若x、y之间的关系是随机的,例如
这时,方程的形式为
称为随机扰动或随机误差项.
其中为随机变量.
对于回归模型,我们假设:
可得到:
如果给出a和b的估计量分别为,则经验回归方程为:
一般地,
称为残差,
y称为因变量,x称为自变量, 称为随机扰动,a,b称为待估计的回归参数,下标i表示第i个观测值。
两个变量之间的线性关系,其回归模型为
残差可视为扰动的“估计量”。
设对y及x做n次观测得数据(xi ,yi) (i=1,2,…,n ).
以(xi ,yi)为坐标在平面直角坐标系中描点,所得到的这张图便称之为散点图.
若散点呈直线趋势,则认为y 与x的关系可以用一元回归模型来描述.
设线性回归方程为 Y=a + bx+ε
其中:ε是随机误差, ε~N(0,σ2).
将(xi,yi) (i=1,2,…,n)逐一代入上式:
二元函数的最小值点称为a,b的最小二乘估计(简记为OLSE ).
记
其中