1 / 9
文档名称:

聚类算法综述.docx

格式:docx   大小:76KB   页数:9页
下载后只包含 1 个 DOCX 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

聚类算法综述.docx

上传人:cengwaifai1314 2019/9/30 文件大小:76 KB

下载得到文件列表

聚类算法综述.docx

相关文档

文档介绍

文档介绍:学术型硕士课程论文(或读书报告)课程名称: 科技论文写作题 目: 数据挖掘中聚类算法的综述题目类型(课程论文或读书报告): 课程论文学 院: 计算机科学与工程学院专业名称: 计算机科学与技术姓 名: 王银学 号: 2015200619任课教师: 潘地林授课时间:2015 年 9 月 6 日~2015 年 11 月 7 日提交时间: 2015 年 12 月 10 日数据挖掘中聚类算法的综述王银(安徽理工大学计算机科学与工程学院,安徽)摘要:聚类是数据挖掘中用来发现数据分布和隐含模式的一项重要技术。本综述按照聚类算法的分类,对每一类中具有代表性的算法进行介绍,分析和评价。最后从发现聚类形状、所适用的数据库和输入数据顺序的敏感性等方面进行了算法推荐,以便对聚类算法作进一步的研究。关键词:数据挖掘;聚类分析;聚类算法Review of Clustering Algorithm in Data MiningAbstract:Clustering is an important technology in Data Mining to discovery data distribution andimplicit model. the classification of clustering algorithms was proposed in this  classhas a representative algorithm is introduced,analysis and  the end,it is suggested thatthe algorithm can be used to further study the clustering algorithm,which is based on the shape ofthe discovery,the database and the order of input :Data Mining;Clustering analysis;Clustering Algorithm1 引言随着信息技术和计算机技术的迅猛发展,人们面临着越来越多的文本、图像、视频以及音频数据,为帮助用户从这些大量数据中分析出其间所蕴涵的有价值的知识,数据挖掘(Data Mining,DM)技术应运而生。所谓数据挖掘,就是从大量无序的数据中发现隐含的、有效的、有价值的、可理解的模式,进而发现有用的知识,并得出时间的趋向和关联,为用户提供问题求解层次的决策支持能力。与此同时,聚类作为数据挖掘的主要方法之一,也越来越引起人们的关注。聚类就是利用计算机技术来实现这目的的一种技术。其输入是一组未分类的记录,且事先不知道如何分类,也可能不知道要分成几类,通过分析数据,合理划分记录集合,确定每个记录所属的类别,把相似性大的对象聚集为一个簇。聚类的标准是使簇内相似度尽可能大、簇间相似度尽可能小。典型的聚类过程主要包括数据准备、特征选择和特征提取、接近度计算、聚类(或分组)、对聚类结果进行有效性评估等[7]步骤。聚类过程:(1)数据准备:包括特征标准化和降维。(2)特征选择:从最初的特征中选择最有效的特征,并将其存储于向量中。(3)特征提取:通过对所选择的特征进行转换形成新的突