文档介绍:多元回归分析→回归→线性,拟合优度检验总离差平方和(tss)=回归平方和(ess)+残差平方和(rss);可决系数的取值范围:[0,1]。R2越接近1,说明实际观测点离样本线越近,拟合优度高。由增加解释变量个数引起的R2的增大与拟合好坏无关,R2需调整。调整的可决系数思路是:将残差平方和与总离差平方和分别除以各自的自由度(df),以剔除变量个数对拟合优度的影响:(2)方程总体线性的显著性检验(F检验H0:1=2==k=0H1:j不全为0FF(k,n-k-1) 或 FF(k,n-k-1)来拒绝或接受原假设H0,以判定原方程总体上的线性关系是否显著成立。(3)变量的显著性检验(t检验)如果变量X对Y的影响是显著的,那么X前的参数应该显著的不为0检验步骤:1)对总体参数提出假设H0:1=0,H1:10若|t|>t/2(n-2),则拒绝H0,接受H1;(小概率事件发生)若|t|t/2(n-2),则接受H0;看指标选模型拟合程度AdjustedR2:越接近1拟合程度越好回归方程的显著性检验F统计量的值,及其Sig回归系数表回归系数B和显著性检验Sig(4)满足基本要求的样本容量从统计检验的角度:n30时,Z检验才能应用;n-k8时,t分布较为稳定四、预测一元或多元模型预测的SPSS实现:特征根和方差比特征根是诊断解释变量间是否存在严重的多重共线性的另一种有效方法。最大特征根的值远远大于其他特征根的值,则说明这些解释变量间具有相当多的重叠信息,原因是仅通过这一个特征根就基本刻画出了所有解释变量的绝大部分信息。解释变量标准化后它的方差为1。如果某个特征根既能够刻画某解释变量方差的较大部分(),同时又可以刻画另一根解释变量方差的较大部分,则说明这两个解释变量间存在较强的线性相关关系。4、条件指数条件指数反映解释变量间多重共线性的指标。当0<=Ki<10时,多重共线性较弱;当10<=Ki<100时,认为多重共线性较强;Ki>=100时,认为多重共线性很强。?分析→回归→线性→绘制→选正态概率图→继续→确定→查看输出窗口→数据点围绕基准线还存在一定的规律性。?分析→回归→线性→保存,选残差中的标准化→继续→确定→分析→非参数检验→1样本k-s(1)把standardizedresidual放入检验变量列表→确定→查看输出窗口,sig(p)表明标准化残差和标准正态分布不存在显著差异,可以认为残差满足了线性模型的前提要求。(该要求是要求残差服从正态分布)?分析→回归→线性→保存,选距离中cook距离,杠杆值→继续→确定→查看输出窗口→没有发现强影响点。(库克距离大于1对应的解释变量为强影响点。杠杆值越高,对应的解释变量就越可能是强影响点)曲线估计分析→预测→序列图→把在外就餐放入变量框分析→回归→曲线估计→因变量在外就餐;自变量年份→模型选指数分布,点保存。非线性预测估计R方=1-(残差平方和)/(已更正的平方和)相关术语ZRE残差标准话 ZPR预测值标准化 LEV距离杠杆值 FIT预测值时间序列1数据的平稳性及其检验一、时间序列数据的平稳性。如果满足下列条件:1)均值与时间t无关的常数;2)方差与时间t无关的常数;3)协方差只与时期间隔k有关,与时间t无关的常数。则称该随机时间序列是平稳的(stationary),而该随机过程是一平稳随机过程(stationarystochasticprocess)若时间序列是一具有零均值同方差的独立分布序列:()该序列常被称为是一个白噪声(whitenoise)如果一个时间序列是非平稳的,它常常可通过取差分的方法而形成平稳序列。检验样本自相关函数及其图形来判断平稳时间序列首先定义随机时间序列的自相关函数,实际上我们对一个随机过程只有一个实现(样本),因此,只能计算样本自相关函数随着k的增加,样本自相关函数下降且趋于零。但从下降速度来看,平稳序列要比非平稳序列快得多,检验对所有k>0,自相关系数都为0的联合假设,这可通过如下统计量,Q值大于显著性水平为的临界值,拒绝所有(k>0)同时为0的假设,软件:检验哪个序列,就打开该序列,点击菜单view下拉菜单corrdlogram,选择level,表示对原始序列的平稳性检验,lagstoinclude处,输入原始序列长度的一半或者稍小于一半的数值。点击确定。若概率很小,说明原序列并不是自相关系数均为零的。说明原序列是非随机的。如果该序列是平稳的,即它的行为并不会随着时间的推移而变化,那么我们就可以通过该序列过去的行为来预测未来。这也正是随机时间序列分析模型的优势所在。四、随机时间序列模型的识别工具主要是时间序列的自相关函数(autocorrelationfunction)ACF及偏自相关函数(partialautocorrelationfunction