1 / 7
文档名称:

模糊C均值聚类算法及实现.doc

格式:doc   大小:186KB   页数:7页
下载后只包含 1 个 DOC 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

模糊C均值聚类算法及实现.doc

上传人:读书之乐 2020/3/10 文件大小:186 KB

下载得到文件列表

模糊C均值聚类算法及实现.doc

文档介绍

文档介绍:模糊C均值聚类算法及实现摘要:模糊聚类是一种重要数据分析和建模的无监督方法。本文对模糊聚类进行了概述,从理论和实验方面研究了模糊c均值聚类算法,并对该算法的优点及存在的问题进行了分析。该算法设计简单,应用范围广,但仍存在容易陷入局部极值点等问题,还需要进一步研究。关键词:模糊c均值算法;模糊聚类;聚类分析Fuzzyc-MeansClusteringAlgorithmandImplementationAbstract:-,canbewidelyused,buttherearestillsomeproblemsinit,andtherefore,:fuzzyc-Meanalgorithm;fuzzyclustering;clusteringanalysis1引言20世纪90年代以来,随着信息技术和数据库技术的迅猛发展,人们能够非常方便地获取和存储大量的数据。可是,面对大规模的数据,传统的数据分析工具只能进行一些表层的处理,比如查询、统计等,而不能获得数据之间的内在关系和隐含的信息。为了摆脱“数据丰富,知识贫乏”的困境,人们迫切需要一种能够智能地、自动地把数据转换成有用信息和知识的技术和工具,这种对强有力数据分析工具的迫切需求使得数据挖掘技术应运而生。将物理或抽象对象的集合分组成由类似的对象组成的多个类的过程称为聚类。由聚类所生成的簇是一组数据对象的集合,这些对象与同一个簇中的对象彼此相似,与其它簇中的对象相异。聚类是一种重要的数据分析技术,搜索而且识别一个有限的种类集合或簇集合,进而描述数据。聚类分析作为统计学的一个分支,己经被广泛研究了许多年。而且,聚类分析也已经广泛地应用到诸多领域中,包括数据分析、模式识别、图像处理以及市场研究[1]。经过聚类,人们能够识别密集的和稀疏的区域,因而发现全局的分布模式,以及数据属性之间的有趣的相互关系。在商务上,聚类能帮助市场分析人员从客户基本信息库中发现不同的客户群,而且用购买模式来刻画不同的客户群的特征。在生物学上,聚类能用于推导植物和动物的分类,对基因进行分类,获得对种群中固有结构的认识。聚类在地球观测数据库中相似地区的确定,汽车保险单持有者的分组,及根据房屋的类型、价值和地理位置对一个城市中房屋的分组上也能够发挥作用。聚类也能用于对Web上的文档进行分类,以发现信息。基于层次的聚类算法文献中最早出现的Single-Linkage层次聚类算法是1957年在Lloyd的文章中最早出现的,之后MacQueen独立提出了经典的模糊C均值聚类算法,FCM算法中模糊划分的概念最早起源于Ruspini的文章中,但关于FCM的算法的详细的分析与改进则是由Dunn和Bezdek完成的。聚