文档介绍:2012全国大学生数学建模竞赛安徽赛区获奖论文
D
2
3
4
度。若评酒员的评分不服从正态分布则可对原始数据进行筛选处理,去除一些偏差极大的数据。然后对剩余的数据进行相同的分析处理。
2﹑对于问题二附表2给出了红白葡萄的理化指标,想要根据酿酒葡萄的理化指标和葡萄酒的质量对酿酒葡萄进行分级,可以用模糊分析,但必须要知道各个主要成分的权重。所以可以通过主成分分析确立主要成分,在通过聚类分析给出各个主要成分的贡献率来确立各自的权重。最后利用模糊分析对酿酒葡萄进行分级。
3﹑对于问题三要找出酿酒葡萄与葡萄酒的理化指标之间的联系,由于酿酒葡萄与葡萄酒都有很多指标,并且酿酒葡萄与葡萄酒的理化指标不对应如果只是采取简单的回归模型的话,不能通过检验。所以采用insight模块实现典型相关分析的方法,通过SAS软件得到了两者之间的联系。
4﹑对于问题四要分析酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响,并论证能否用葡萄和葡萄酒的理化指标来评价葡萄酒的质量?由于酿酒葡萄和葡萄酒的理化指标是影响葡萄酒质量的因素。是不是直接用酿酒葡萄和葡萄酒的理化指标来评价葡萄酒的质量?我们需要去论证,这里分别对红白葡萄的酿酒葡萄与葡萄酒的理化指标进行数据处理,并且只考虑一级指标,根据葡萄酒、酿酒葡萄分别与感官分析的结果,,经过对数据的相关分析、通径分析、变异系数分析、主成分分析、聚类分析以及回归分析过程可以得到葡萄酒和酿酒葡萄的理化指标对葡萄酒质量影响的大小。从而可以判断出不能用葡萄和葡萄酒的理化指标来评价葡萄酒的质量。
模型假设
1﹑假设评酒员对各样品的评价不受外界因素干扰。
2﹑假设各葡萄样品均采自良好的生长环境,能保证本种葡萄的特性。
3﹑假设评酒员能对样品进行客观的评价。
定义与符号说明
值
5
第个变量的平均值
第个变量的标准差
模糊关系矩阵
评价结果矩阵
权重矩阵
模糊评价矩阵
问题一的模型建立与求解
一﹑模型的分析
1﹑要想知道两组评酒员评价结果有无显著性差异以及哪一组结果更可信,若评酒员的评分服从正态分布则可用T检验分析比较两组评酒员评分的平均值。这点可用matlab软件进行计算。
2﹑若评酒员的评分不服从正态分布则可对原始数据进行筛选处理。经分析得知对于白葡萄酒的评分,第一组评酒员2号对于葡萄酒样品2﹑5﹑6﹑15﹑18﹑22等的评分明显低于整体评分均值水平,第二组评酒员8号对于葡萄酒样品3﹑9﹑12﹑15﹑21﹑26等的评分明显低于整体评分均值水平。因此,我们排除极值的影响,对剩余数据重新进行正态检验。发现此时整体评分数据服从正态分布。既而我们仍可以用matlab进行T检验。
3﹑根据matlab软件进行T检验得出T值及P值,,说明两组评酒员对相应种类葡萄酒的评价存在明显的差异,此时对比分析相应的方差可看出第一﹑第二组评酒员评价结果的可信度。
二﹑模型建立与求解
首先根据附表1给出的评酒员评分情况分别对第一﹑二组的评价总分数据进行正态检验(程序见附录)。
可知,第一﹑二组10位评酒员对红葡萄酒评价总分的数据服从正态分布,可用T检验(程序见附录)进行分析。
算出两组评酒员对红葡萄酒评分的平均值﹑方差﹑标准差﹑T﹑P值,如下表所示。
第一组
第二组
T
P
样本编号
均值
方差
标准差
均值
方差
标准差
-
12
23
2
74
11
16
13
24
78
6
3
45.