文档介绍:万方数据
聚类分析在学生成绩管理巾昀应用敏刘聚类分析笱粞г菏в胄畔⒖蒲аг海笾莨笱引言使用传统划分方法对学生原始成绩进行分析评定,虽然简便易行、标准统一,但这种方法是基于绝对分数的评价,存在一些缺陷,不利于对学生的法通常将成绩高于分的学生作为优秀,高于成绩低于某分数,这可能是由于教师评分标准较严或试卷难度较大。此时再以高于分作为优秀的评定标准是不合理的,应该调整评定标准。可见在对象实际原始属性差别不大的情况下使用传统划数据中发现其中隐藏的信息,对实验结果的分析可数据挖掘能从海量的数据中提取隐藏的、人们一—第淼期年贵阳学院学报匀豢蒲О究学习情况做出客观真实的评价。例如,传统划分方分的学生作为良好。若某次考试绝大多数学生的分方法,其评定结果可能相差较大,而且当考试科目较多时,不能反映学生成绩在全部数据域内的变化趋势。数据挖掘中的聚类分析方法可以从大量以发现,使用基于数据挖掘的聚类分析方法对学生成绩进行分析,可以有效弥补传统分析方法的缺陷,能够科学、合理地反应学生的学的提高提供参考。聚类分析概述事先不知道的、但是潜在有用的知识和信息,它是摘要:对高校学生考试成绩进行分析是教学管理的重要工作之一,,不能客观而全面的反映学生的学习情况。使用数据挖掘中聚类分析方法对学生的原始成绩进行分析,可以有效地克服传统分析方法的缺陷。实验结果表明:猰算法对学生成绩进行快速聚类具有较高的效率,能够有效地克服传统分析方法的缺陷。关键词:数据挖掘;聚类分析;猰算法中图分类号:文献标识码:文章编号:———.,瓵收稿日期:一一基金项目:贵阳学院院级项目“聚类分析在学生成绩管理中的应用研究”钅勘嗪牛阶段性成果。作者简介:刘敏,女,贵州贵阳人,贵阳学院讲师。主要研究方向:计算机逃τ眉笆萃诰蛩惴ㄑ芯俊珿,:’.,琋..珽:,篋;;猰—
万方数据
略鰇—距离:艻石谴一∑∑.,弓渲校瑉堑趇个对象,弓是第锤魇粜灾畹钠道治应用于各个领域。数据挖掘过程可以分为数据准鞘萃诰蛄煊虻闹要技术之一。聚类分析是指将物理或抽象对象的过程,这一过程要求根据数据自身的距离或相似度将数据分组,所以同一个簇中的对象有很大的相似性,而不同簇间的对象有很大的相异性。¨劾嘤分类的区别在于:分类是用已知的知识对新的样本进行归类,而聚类发现的知识是未知的。在聚类分析中对于数值型数据常用距离来衡量对象间的相方和之平方根,在实际应用中,常用欧氏平方距离:的方法。猰算法是常用的基于划分的聚类算法,该算法认为两个对象的距离越近,其相似性就越大;该算法的目的是找到一组聚类中心和隶属矩阵,使得目标函数值最小。常用的目标函数为猰算法思路是:首先从鍪荻韵中随机选取龆韵笞魑3跏季劾嘀行聚点计算所剩下的其它每个对象到这些聚类中心的距离,分别将它们归到离它最近的聚点,从而得到一组聚类;然后,计算该聚类中所有对象的均值得出当前每个聚类的中心作为新的聚点,并把每个对象相邻两次的聚点没有任何变化,说明聚类目标函数已经收敛,算法结束。最终得到的鼍劾嗟奶点是:各聚类本身尽可能的紧凑,而各聚类之间尽可能的分开。猰算法的迭代过程如图学生成绩是学生信息数据库中最重要的组成部分,在学生成绩统计表中,可能存在错误数据或有冲突的数据,这些错误的或有冲突的数据称之为“脏数据”。为了满足数据挖掘