文档介绍:葡萄酒的评价一、 摘要木文主要研究了葡萄酒的评价问题,涉及到多方面的因素,如品酒员的打分和葡萄酒的理化指标等。引入主成分分析的概念,将多个指标进行简化提出主要因了,再利用主要因了建立单因素方羌模型;在对酿葡萄酒进行分及时将酿葡萄酒的理化指标和葡萄酒的质量进行聚类分析;通过典型相关分析得出酿酒葡萄和葡萄酒的理化指标之间的联系;最后再通过多元线性冋归模型得出能用葡萄酒和葡萄酒的理化指标来评价葡萄酒的质量。问题一研究两组品酒员对红白葡萄酒的感官评价打分是否冇无显著性差异,针对这一问题首先综合品酒员的各项打分,求出每位品酒员对酒样的各项评价分值总和作为对每一酒样评价的最终结果,再以此作为因变量建立单因素方差分析模型。我们用置信区间法调整打分数据,降低品酒员的主观的影响,通过T检验比较显著性水平〃与置信水平g=,白葡萄酒无显著性差异;对于两组评价结果的可信度检验,我们将分别计算出两组的方差,进行比较得出第一组比第二组更可信。问题二是根据附件二屮酿酒葡萄的理化指标和葡萄酒的质量对这些酿酒葡萄进行分级。鉴于大量的变量因子和数据,本文选择了主成分分析对数据变量进行降维,试图寻在力保数据信息丢失最少的原则下寻找影响葡萄分级的最主要因索,用MATLAB处理数据,综合分析可得出以下结果:第1主成分与还原糖、总糖、可溶性固形物有较大的止相关;第2主成分与总酸、VC有较大正相关,但与固酸比冇较大的负相关;第3主成分与单宁、多酚含量冇较大正相关。通过相关性分析得岀还原糖与总糖、可溶性固形物呈极显著正相关;固酸比与可溶性物呈极显著正相关,与总酸、VC呈极显著负相关,其屮总酸与VC含量呈极显著正相关,这与主成分分析的结果具冇一致性。最后通过对这些主因子的聚类得到还原糖、总糖和可溶性固形物为一类,总酸与VC聚成一•类,总酚与单宁为一•类,固酸比为单独一类并将酿酒葡萄分为了三类。问题三是对酿酒葡萄和葡萄酒的理化值作分析,根据附件2的数据我们将葡萄酒和酿洒葡萄看成X组和Y组变量,由问题二的分析可以得出花色昔、单宇、总酚3个指标是影响葡萄酒的质量的主要因子,再对酿葡萄酒的理化指标进行主成分分析,并将28个指标简化成了总酸、蛋白质、褐色度、花色昔、果皮质量这5个主成分因子。最终利用典型相关系数分析法分析出酿酒葡萄和葡萄酒的理化指标有较高的相关性。对于问题四,我们在问题三的基础上运用多元线性冋归对酿酒葡萄和葡萄酒的理化指标作进一步分析。曲问题二的分析我们将花色昔、单宁作为因变量,酿葡萄酒屮的总酸、蛋口质、褐色度、花色昔、果皮质量作为自变量进行线性回归分析。根据残差效果分析出总酸、花色苜、单宁的含量越高葡萄酒的质量越好。关键字:主成分分析单因素方差分析聚类分析典型相关系数分析多元线性回归二、 问题重述确定葡萄酒质量时一般是通过聘请一批有资质的评酒员进行品评。每个评酒员在对葡萄酒进行品尝后对其分类指标打分,然后求和得到其总分,从而确定葡萄酒的质量。酿泗葡萄的好坏与所酿葡萄酒的质量有直接的关系,葡萄酒和酿酒葡萄检测的理化指标会在一定程度上反映葡萄酒和葡萄的质量。附件1给出了某一年份一些葡萄酒的评价结果,附件2和附件3分别给出了该年份这些葡萄酒的和酿酒葡萄的成分数据。请尝试建立数学模型讨论下列问题:分析附件1中两组评酒员的评价结果有无显著性并界,哪一组结果更可信?根据酿酒葡萄的理化指标和葡萄酒的质量对这些酿酒葡萄进行分级。分析酿酒葡萄与葡萄酒的理化指标之间的联系。分析酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响,并论证能否用葡萄和葡萄酒的理化指标来评价葡萄酒的质量?三、问题分析对于分析两组品酒员的评价结果有无显著差异。我们首先分析附录一中的数据。由于第一、二组都有品酒员对白红葡萄酒的打分,为了比较评价结果是否具有显著性差异,现将第一组品酒员对白酒的打分和第二组品酒员对白酒的打分,第一组品酒员对红酒的打分和第二组品酒员队红酒的打分进行显著性分析。由于品酒员决定着打分情况进而我们将瓶酒员视为一个因子建立了单因素方差分析模型。通过置信区间法调整原始数据,有效降低品酒员间的主观差杲,比较真实的反应酒样间的客观差异,在cz=,若hva,则无显著性差异,若h>a,则冇显著性差异。对于哪组结果更可信,我们利用MATLAB软件将每组的白红葡萄酒打分均值与方差计算出来。并比较两组的方差大小,方差大则可信度更高,反Z则可信度低。问题二要求根据酿葡萄酒的理化指标和葡萄酒的质量对酿葡萄酒进行分级。对于进行过多次试验得出的葡萄理化指标数据我们对其取平均值进行分析,由于二级指标对葡萄酒的质量影响不人,所以我们仅分析一•级指标对葡萄酒分级的影响。对于这一问题,我们先后使用了主成分分析、相关性分析和判别聚类的多元统计方法。主成分分析能将