1 / 5
文档名称:

K均值聚类在成绩分析中的应用.docx

格式:docx   大小:253KB   页数:5
下载后只包含 1 个 DOCX 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

K均值聚类在成绩分析中的应用.docx

上传人:科技星球 2022/2/6 文件大小:253 KB

下载得到文件列表

K均值聚类在成绩分析中的应用.docx

文档介绍

文档介绍:K均值聚类在成绩分析中的应用
 
 
高若兰
一、引 言
学生分类是教师教学过程中要了解的重要问题,同时也是实现个性化教学的重要基础。教师在充分掌握了学生的分类情况下,可以为不同类型的学生提供更具针对性的教学策 
 
K均值聚类在成绩分析中的应用
 
 
高若兰
一、引 言
学生分类是教师教学过程中要了解的重要问题,同时也是实现个性化教学的重要基础。教师在充分掌握了学生的分类情况下,可以为不同类型的学生提供更具针对性的教学策略,极大地发挥教师和学生的主观能动性。
将学生的各门课程成绩直接相加得到总分,根据总分进行排名分类是目前较为普遍的做法。但是这样的做法过于简单,没有考虑课程的难易程度。因此,我们将提出一种基于K均值聚类的学生成绩分析方法。K均值聚类方法是非常经典的无监督分类方法,不需要任何的先验知识。K均值聚类方法以各类样本的中心为聚类中心不断进行迭代更新,直至达到迭代终止条件,但是需要先选择聚类的个数。因此,如何选择合适的聚类个数也是热点问题。利用matlab将数据符合的最佳聚类个数确定出来,然后基于K均值聚类的方法对规范化后的数据进行分类处理。最后,根据分类结果对学生成绩进行分析。
二、K均值聚类
相近的样本数据组成不同的类别,以得到紧凑而且独立的类别作为最终目标。具体的步骤如下:
如果,则将分为第L类。
接着,根据 n 个样本的分类结果重新计算 k 个聚类中心,可以利用如下公式:。其中,Nj 是第 Cj 类中所包含的样本数。
不断地重复这一过程,,:
k 均值聚类算法的主要特点就是每一次迭代过程都需要对所有的样本数据点重新计算其与聚类中心之间的距离,并由此重新分配所属类别,然后更新聚类中心,,所有数据点的类别数没有发生变化,而且聚类中心也没有发生变化, 均值算法较大的局限性就是需要预先估计聚类个数,只有在聚类个数已知的前提下,算法才能继续进行.
三、成绩分析结果
数据准备
数据来自于本校研一某专业27名学生的录取成绩,包括四门课程——政治、英语、数学、专业课,其中政治、英语满分100分,数学、专业课满分150分,用EXCEL表格计算学生的直接总分,并排名次,得到数据表1.
数据分析
首先