文档介绍:加权修正后的主成分分析模型和多元时间序列分析
在建模评价,排序与预测中的应用
摘要
数学建模活动自1992年开办20年以来,不断深入融入大学教育,对大学生整体思维创新和应用有着举足轻重的影响。由此,对20年的建模工作通过分析,评估进行总结和对未来发展进行预测。
分析:首先看到问题一,问题二,问题三与问题四四均是同一类型的问题,因此可以考虑建立统一模型进行同时求解。这四个问题都是要求利用一定的数据进行评价,排序和预测:对于评价,排序我们很快能想到主成分分析,利用得分函数,计算得分;对于预测,很自然我们就想到了时间序列分析,观察数据可以发现数据是面数据(既是序列数据,又是截面数据),因此应该是用多元时间序列分析。
解决:对于前四个问题我们都是采用加权修正后的主成分分析模型进行评价,排序和预测:
,excel软件进行相应的处理从而建立原始数据矩阵;
;
,以及相应的特征向量;
;
;
,对综合评价函数进行加权修正,利用修正后的综合评价函数通过matlab软件求综合评价值;
,通过sas软件利用多元时间序列分析进行预测。
第五个问题,便是从前四问的计算建模过程中总结出来的:
,即时间轴上的样本数据需要足够才能保证评价和排序的科学,合理;
,即对于能影响建模评价的参赛队伍数,报名组数,学校开展建模时间都加入变量行列中,能增加主成分分析的信息含量和可信度。
而整篇文章最大的亮点在于主成分分析思想与加权思想的几何,使得模型更符合实际。
关键字
主成分分析,加权修正,得分函数,多元时间序列分析,sas,matlab软件
问题重述
在数学建模活动开展20周年之际,建模活动对大学教育产生深刻的影响,使大学生整体素质和能力创新得到了全面锻炼。于此,有必要对以往的数学建模工作进行总结及对未来的发展进行预测,分析建模在全国大学中起到的作用和影响。
考虑完成以下任务:
问题一要求对某校“十一五”规划期间的建模成绩进行评价和预测该校“十二五”规划期间的建模成绩;
问题二要求对吉林赛区所有院校在“十一五”规划期间的建模成绩进行评价,排序和预测所有院校在“十二五”规划期间的建模成绩;
问题三和问题四分别要求对全国所有获过奖的院校在1994-2010十七年间(本来是1949-2011十八年,由于所给2011的数据无法导入,本文就只能使用十七年的数据)的建模成绩进行评价,排序和预测这些院校在“十二五”规划期间的建模成绩;
找出影响建模评价的其他因素。
问题
前四个问题都是要求利用一定的数据进行评价,排序和预测:对于评价,排序我们很快能想到主成分分析,利用得分函数,计算得分;对于预测,很自然我们就想到了时间序列分析,观察数据可以发现数据是面数据(既是序列数据,又是截面数据),因此应该是用多元时间序列分析;
第五个问题就是在解决前四个问题的过程中总结出来的。
模型的假设
进行主成分分析时,假设数据之间没有自相关作用
每次建模竞赛的题目难易程度都是一致的
本科与专科(甲组和乙组)题目难易是一样的
本科与专科(甲组和乙组)一,二等奖的价值是一样的;
学校排名不区分专科院校和本科院校
模型的建立和求解
问题一
构建原始数据矩阵
针对第一个问题,要对某学校建模成绩进行评价,可以把该学校2006-2011六年的建模成绩n1-n6看做6个样本,每个样本有7个项目成绩为
:国家一等奖,:国家二等奖,:省一等奖,:省二等奖,省三等奖,成功参赛:参赛队数,构成了原始数据矩阵为
X=
其中:i = 1,2,…,6; j= 1,2,…,7.
建立相关系数矩阵
建立原始数据矩阵x后,利用sas软件求出了7个项目成绩的相关系数矩阵R.
R=
相关系数矩阵表明了7个项目成绩彼此之间的相关程度.
计算特征值及其特征向量
再次利用sas软件计算出相关系数矩阵R的特征值A及其相应的单位特征向量.
其中Al≥A2≥…≥A7>0;
计算各主成分的方差贡献率和累积方差贡献率
利用sas软件求解如下:
方差贡献率表示第k个主成分分别提取原始7个项目的信息量,反映了第k主成分综合原始变量信息的百分比;累积方差贡献率表示前k个主成分保留的原始项目的信息量,反映了前面k主成分综合原始变量信息的百分比