文档介绍:分析酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响,并论证能否用葡萄和
葡萄酒的理化指标来评价葡萄酒的质量
问题 4 的分析
问题四要求研究酿酒葡萄与葡萄酒的理化指标对葡萄酒质量的影响,以及是
否能完全用酿酒葡萄和葡萄酒的理化指标评价葡萄酒的质量。我们将提取葡萄及
葡萄酒的理化指标与芳香物质中的主成分,利用逐步回归的方法考察理化指标与
芳香物质对葡萄酒质量的影响程度,通过对芳香物质对葡萄酒质量影响比重得到
芳香物质对葡萄酒的质量有 30%以上的影响比重(白葡萄的芳香物质对白葡萄酒
的质量影响相对更大),故而不能完全用酿酒葡萄和葡萄酒的理化指标评价葡萄
酒的质量。
逐步回归分析模型的建立
逐步回归法是一种变量筛选方法。逐步回归法采取边进边退的方法,对于模
型外部的变量,只要它还可提供显著的解释信息,就可以再次进入模型;而对于
已在内部的变量,只要它的偏 F 检验【6】不能通过,则还可能从模型中被删除。
(1)偏F 检验
在决定一个新的变量是否有必要进入模型,或者判断某个变量是否可以从模
型中删除时,考虑这个变量能否对 y 提供显著的附加解释信息?现采用偏 F 检
验。
设有个自变量,采用这个自变量拟合的模型称为全模型,即
n x12,,,x xn n
yb01122 bxbx bxnn
从这 n 个变量中删除自变量 x j ,这时用 n 1个自变量拟合模型称为减模型,
即
yb011 bx bxjj 11 bx jj 11 bx nn
2 2
全模型的复判定系数为 R ,减模型的复判定系数记为 R j 。定义
222
R jjRR
2
由于在全模型中多一个自变量 x j ,所以,若R j 几乎为零,说明增加 x j ,
2
对 y 的解释能力没有显著提高;否则,若R j 显著不为零,则 x j 就可以为回归模
型提供显著的解释信息。
22
给出统计假设 HR01:0,:jj HR 0
统计检验量为
QQ
F j
j Qnm(1)
式中,Q j 是减模型的残差平方和,Q 为全模型的残差平方和。
根据检验水平查F 分布表,得到拒绝域的临界值 F,则决策准则如下:
2
( i )当 FFj 时,拒绝 H0 , 说明Rj 显著不为零,这说明在
变量已进入模型后,引入会显著提高对的解释能力;
x11,,xxjj, 1,,xn x j y
2
(i)当 FFj 时,接受 H0 ,说明R j 显著为零,这说明在全模型中删除 x j ,
对 y 的解释能力无显著的减弱变化。
(2)逐步回归分析
模型的起始首先要求y 与每一个 xi 的一元线性回归方程,选择F 值最大的变
量进入模型。然后,对剩下的 n 1个模型外的变量进行偏F 检验(设定 xi1 已在
模型中),在若干通过偏F检验的变量中,选择Fj 值最大者进入模型。再对模型
外的n 2 个自变量做偏F 检验。在通过偏F 检验的变量中选择Fj 值最大者进入
模型。接着对模