1 / 12
文档名称:

数学与应用数学毕业论文-应用主成分对学生综合素质进行评价.doc

格式:doc   页数:12
下载后只包含 1 个 DOC 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

数学与应用数学毕业论文-应用主成分对学生综合素质进行评价.doc

上传人:3346389411 2013/1/9 文件大小:0 KB

下载得到文件列表

数学与应用数学毕业论文-应用主成分对学生综合素质进行评价.doc

文档介绍

文档介绍:应用主成分对学生综合素质进行评价
数学系 01数本指导老师:林志兴
摘要:运用主成分分析方法,对高校学生的综合素质进行评价。避免传统方法在综合评价中对指标的主观选择及对权重的主观判断,使权重的分配更合理,尽可能地减少重叠信息的不良影响,克服变量之间的多重相关性,简化系统分析。
关键词:主成分分析; 综合素质;评价
0 引言
高校对学生在德,智,体等方面表现进行综合评价时,一般均按照科学、实用、简便等原则设置一套综合指标评价体系,通过对上述各方面的具体量化,取得相应的数值,通过计算,数据处理,最终得到一个综合得分并进行综合排名,作为主要的评价依据给以奖励或批评。建立评价的核心问题有两个主要内容:(1)科学设立综合评价指标体系。(2)确定综合记分时各指标的权重系数。
在对学生的综合素质进行评价时,传统的做法是从现有的指标中精选出若干个有代表性的指标。但人为地精选指标难免带有主观随意性,可能丢失部分有价值的原始信息。
而利用主成分分析法对多维变量进行降维,降维后的变量是原变量的线性组合,并能反映原变量绝大部分的信息,使信息的损失最小,对原变量的综合解释能力强。该方法通过主成分的方差贡献率来表示变量的作用,可避免在系统分析中对权重的主观判断,使权重的分配更合理,尽可能地减少重叠信息的不良影响,克服变量之间的多重相关性,使系统分析简化。
从实际的运行结果来看,应用主成分分析法对高校学生的综合素质进行评价总体上是合理的,这能为大学生在校学的育人环境,使他们能将更多的精力用于专业学习,培养学生具有健全的人格,因此是有积极意义的。
1 主成分分析的基本原理
什么是主成分分析
在实际问题中,研究多指标(变量)问题是经常遇到的,然而在多少情况下,不同的指标之间是有一定的相关性。由于指标较多再加上指标之间有一定的相关性,势必增加了分析问题的复杂性。主成分分析就是设法将原来指标重新组成一组新的互相无关的几个综合指标来代替原来指标,同时根据实际需要从中可取几个较少的综合指标尽可能多地反映指标的统计方法叫做主成分分析或称主分量分析。通常数学上的处理就是将原来p个指标作线性组合,作为新的综合指标,如果不加限制,则可以有很多,我们应该如何去选取呢?如果将选取的第一个线性组合即第一个综合指标记为,自然希望尽可能多的反映原来指标的信息,这里的“信息”用什么来表达?最经典的方法就是用的方差来表达,即越大,表示包含的信息越多。因此在所有的线性组合中所选取的应该是方差最大的,故称为第一主成分。如果第一主成分不足以代表原来p个指标的信息,再考虑选取即选第二个线性组合,为了有效反映原来信息,已有的信息就不需要出现在中,用数学语言表达就是要求,称为第二主成分,依此类推可以构造出第三,四,第p个主成分。虽然这样做会损失一部分信息,但是由于它使我们抓住了主要矛盾,并从原始数据中进一步提取了某些新的信息,因而在某些实际问题的研究中得益比损失大。

通过可数变量的几个线性组合来概括大部分原始信息。用k个变量的n次观测数据代替p (k<p)个原变量的几次观测数据,而基本的信息量保持不变。
设有样本容量为n的p个变量,通过变换将原变量转换成主成分(用F表示),主成分是原变量的线性组合,且具有正交特征,即将综合成k (k<p)个变量,可用多项式表示:
这样确定的综合变量分别称作原变量的第一、第二、…、第k个主成分,且在总方差中占的比例依次递减。
2 实例及其计算步骤
原始数据来源:莆田学院01级数学与应用数学专业本科班37位同学2003—2004学年各门课程的学习成绩。(成绩表见附表一)
该学年该班同学共修了10门课程,每位同学均有成绩,即没有缺失值。具体的指标为:高等代数,数学分析1,C语言,英语1,心理学,邓小平理论,英语2,常微分,近世代数,数学分析2。
原始资料矩阵为
标准化
一般情况下,进行主成分分析,由于原始数据各指标的量纲不同,分析时需进行标准化处理,具体布骤是:
(1)中心化
将原始数据变换成:
其中,为每一列指标的平均值。针对变换的结果,得到新矩阵
(2)标准化
将矩阵中的数据变换成。其中,为每一列指标的均方差。
经过中心化和标准化处理后,得到新的矩阵
,求特征值和单位特征向量
根据样本相关系数矩阵求出其特征值,以及对应的单位正交化特征向量, 。然后根据主成分的累计率(数值上等于特征值的累积贡献率),确定取k个主成分即前k个主成分的累计贡献率达到85%以上。
表1
主成分
特征值
方差贡献率(%)
累计方差贡献率(%)