1 / 13
文档名称:

Excel回归分析结果的详细阐释.doc

格式:doc   大小:2,692KB   页数:13页
下载后只包含 1 个 DOC 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

Excel回归分析结果的详细阐释.doc

上传人:儒林 2024/4/30 文件大小:2.63 MB

下载得到文件列表

Excel回归分析结果的详细阐释.doc

相关文档

文档介绍

文档介绍:该【Excel回归分析结果的详细阐释 】是由【儒林】上传分享,文档一共【13】页,该文档可以免费在线阅读,需要了解更多关于【Excel回归分析结果的详细阐释 】的内容,可以使用淘豆网的站内搜索功能,选择自己适合的文档,以下文字是截取该文章内的部分文字,如需要获得完整电子版,请下载此文档到您的设备,方便您编辑和打印。Excel回归分析结果的详细阐释2Excel回归分析结果的详细阐释利用Excel的数据分析进行回归,可以得到一系列的统计参量。下面以连续10年积雪深度和灌溉面积序列(图1)为例给予详细的说明。图1连续10年的最大积雪深度与灌溉面积(1971-1980)回归结果摘要(SummaryOutput)如下(图2):3coefficient),或称拟合优度(goodnessoffit),它是相关系数的平方,即有R2==。Adjusted对应的是校正测定系数(adjusteddeterminationcoefficient),计算公式为式中n为样本数,m为变量数,R2为测定系数。对于本例,n=10,m=1,R2=,代入上式得标准误差(standarderror)对应的即所谓标准误差,计算公式为这里SSe为剩余平方和,可以从下面的方差分析表中读出,即有SSe=,代入上式可得最后一行的观测值对应的是样本数目,即有n=10。第二部分,方差分析表方差分析部分包括自由度、误差平方和、均方差、F值、P值等(表2)。表2方差分析表(ANOVA)4逐列、分行说明如下:第一列df对应的是自由度(degreeoffreedom),第一行是回归自由度dfr,等于变量数目,即dfr=m;第二行为残差自由度dfe,等于样本数目减去变量数目再减1,即有dfe=n-m-1;第三行为总自由度dft,等于样本数目减1,即有dft=n-1。对于本例,m=1,n=10,因此,dfr=1,dfe=n-m-1=8,dft=n-1=9。第二列SS对应的是误差平方和,或称变差。第一行为回归平方和或称回归变差SSr,即有它表征的是因变量的预测值对其平均值的总偏差。第二行为剩余平方和(也称残差平方和)或称剩余变差SSe,即有它表征的是因变量对其预测值的总偏差,这个数值越大,意味着拟合的效果越差。上述的y的标准误差即由SSe给出。第三行为总平方和或称总变差SSt,即有5它表示的是因变量对其平均值的总偏差。+=,即有而测定系数就是回归平方和在总平方和中所占的比重,即有显然这个数值越大,拟合的效果也就越好。第四列MS对应的是均方差,它是误差平方和除以相应的自由度得到的商。第一行为回归均方差MSr,即有第二行为剩余均方差MSe,即有显然这个数值越小,拟合的效果也就越好。第四列对应的是F值,用于线性关系的判定。对于一元线性回归,F值的计算公式为式中R2=,dfe=10-1-1=8,因此第五列SignificanceF对应的是在显著性水平下的Fα临界值,其实等于P值,即弃真概率。所谓“弃真概率”即模型为假的概率,显然1-P便是模型为真的概率。可见,P值越小越好。对于本例,7P=<,%以上。第三部分,回归参数表回归参数表包括回归模型的截距、斜率及其有关的检验参数(表3)。表3回归参数表第一列Coefficients对应的模型的回归系数,包括截距a==,由此可以建立回归模型或第二列为回归系数的标准误差(用或表示),误差值越小,表明参数的精确度越高。这个参数较少使用,只是在一些特别的场合出现。?一文中将斜率对应的标准误差值作为分形演化的标准,(参见EPB2000)。不常使用标准误差的原因在于:其统计信息已经包含在后述的t检验中。7第三列tStat对应的是统计量t值,用于对模型参数的检验,需要查表才能决定。t值是回归系数与其标准误差的比值,即有,根据表3中的数据容易算出:,对于一元线性回归,t值可用相关系数或测定系数计算,公式如下将R=、n=10、m=1代入上式得到对于一元线性回归,F值与t值都与相关系数R等价,因此,相关系数检验就已包含了这部分信息。但是,对于多元线性回归,t检验就不可缺省了。第四列Pvalue对应的是参数的P值(双侧)。当P<,可以认为模型在α=,或者置信度达到95%;当P<,可以认为模型在α=,或者置信度达到99%;当P<,可以认为模型在α=,%。对于本例,P=<,故可认为在α=,%。P值检验与t值检验是等价的,但P值不用查表,显然要方便得多。9最后几列给出的回归系数以95%为置信区间的上限和下限。可以看出,在α=,截距的变化上限和下限为-,,即有第四部分,残差输出结果这一部分为选择输出内容,如果在“回归”分析选项框中没有选中有关内容,则输出结果不会给出这部分结果。残差输出中包括观测值序号(第一列,用i表示),因变量的预测值(第二列,用表示),残差(residuals,第三列,用ei表示)以及标准残差(表4)。表4残差输出结果预测值是用回归模型计算的结果,式中xi即原始数据的中的自变量。从图1可见,9x1=,代入上式,得其余依此类推。残差ei的计算公式为 从图1可见,y1=,代入上式,得到其余依此类推。标准残差即残差的数据标准化结果,借助均值命令average和标准差命令stdev容易验证,残差的算术平均值为0,。利用求平均值命令standardize(残差的单元格范围,均值,标准差)立即算出表4中的结果。当然,也可以利用数据标准化公式逐一计算。将残差平方再求和,便得到残差平方和即剩余平方和,即有利用Excel的求平方和命令sumsq容易验证上述结果。以最大积雪深度xi为自变量,以残差ei为因变量,作散点图,可得残差图(图3)。残差点列的分布越是没有趋势(没有规则,即越是随机),回归的结果就越是可靠。用最大积雪深度xi为自变量,用灌溉面积yi及其预测值为因变量,作散点图,可得线性拟合图(图4)。10