文档介绍：2012年北京大学生数学建模与计算机应用竞赛论文答辩
基于感官分析和理化指标对葡萄酒的评价
主要内容
一、摘要
二、问题的理解与分析
三、基本假设
四、模型的建立与求解
五、结果与评价
我们通过对两组感官分析结果的差异性分析以及对葡萄与葡萄酒理化指标相关度的分析,建立了基于理化指标的葡萄酒质量评价体系。
针对问题一,我们通过双因素方差分析模型,得到了两组评价结果有显著性差异并采用了第二组的评价结果。针对问题二,我们聚类分析后根据质量分数综合得到葡萄的分级结果。
针对问题三,我们通过回归方程建立了理化指标之间的联系,并根据典型相关分析模型进一步得出指标间关联。
针对问题四,我们通过逐步多元线性回归分析,得到理化指标对葡萄酒质量的影响方程。
摘要
问题的理解与分析
【问题一】由于所给数据中酒样品间分数差异较大,所以选用双因素方差分析。基于波动性分析,我们选出可信结果。
【问题二】先将葡萄酒评价总分进行转化,根据葡萄的理化指标初步分级后,用葡萄酒的质量进行校正。
【问题三】选出对各个葡萄酒影响最大的葡萄的理化指标后,对每一个葡萄酒的理化指标建立回归方程,用典型相关分析模型进行了分析,进一步得出指标间的关联。
【问题四】我们建立了回归方程来表示理化指标对葡萄质量的影响程度。
基本假设
1、假设不同评酒员的评分是相互独立的,同一评酒员对不同葡萄酒的评分也是相互独立的。
2、葡萄和葡萄酒的理化指标完全能够代表葡萄和葡萄酒的性质。
3、评酒员的最终评分服从正态分布。
4、假设每个评酒员都是客观公正的,将严格按照标准品评葡萄酒。
问题一:
为了得到评价结果的差异性分析,我们只需要对两组评价结果进行双因素方差分析即可。判定可信度即对评价结果进行离散程度比较。
模型一建立:
1、显著性差异的分析模型——双因素方差分析模型
①总体的双因素方差分析模型
若组别有个水平,样品有个水平。在组别的第个水平和样品的第个水平下进行了观测,记为。
考虑以下模型:
式中, 表示平均的效应; 和分别表示组别的第个水平和样品的第个水平的附加效应。
模型的建立与求解
模型一的结果
根据以上模型过程由SAS软件实现,得到p值结果整理为下表,得到两组评酒员的评价结果有显著性差异。
总体
组别
酒样品
红葡萄酒

白葡萄酒

②各个指标的显著性差异分析模型
利用SAS软件进行均值假设检验,得到p值结果:
模型一的结果
红葡萄酒
白葡萄酒
p值
显著性
p值
显著性
澄清度

无

无
色调
<
有

无
香气纯正度
<
有

无
香气浓度

无

无
香气质量

有

无
口感纯正度

无
<
有
口感浓度

无

有
口感持久性

无

无
口感质量

无
<
有
平衡/整体评价

无

有
2、可信度分析
为了分析两组评酒员的评酒结果可信度,本文首先求出每个样品中各个项目10个评酒员的评分的标准差,然后通过将不同样品同一指标的标准差求和,得到各个组不同评分指标的标准差之和。画出折线图后,可以更加直观地比较了两组的差异。
模型的结果
由下图显然可见,无论是红葡萄酒还是白葡萄酒,二组的各项指标评分标准差都小于一组的评分标准差,说明第二组评酒员的评分更集中,波动性比较小。由此可见,第二组的评酒结果更可信。
模型一的结果