文档介绍：[1],是人们认和探索事物之间内在联系的有效手段,它既可以用作独立的据挖掘工具,来发现数据库中数据分布的一些深入信息,也以作为其他数据挖掘算法的预处理步骤。所谓聚类(clus-ring)就是将数据对象分组成为多个类或簇(cluster),在同一簇中的对象之间具有较高的相似度,而不同簇中的对象差别大。传统的聚类算法主要分为四类[2,3]:划分方法,层次方法,于密度方法和基于网格方法。受生物进化机理的启发,科学家提出许多用以解决复杂优问题的新方法,如遗传算法、进化策略等。,它是一种新型的优化方法[4]。该算不依赖于具体问题的数学描述,具有全局优化能力。随后他其他学者[5~7]提出一系列有关蚁群的算法并应用于复杂的组优化问题的求解中,如旅行商问题(TSP)、调度问题等,取得著的成效。后来其他科学家根据自然界真实蚂蚁群堆积尸体分工行为,提出基于蚂蚁的聚类算法[8,9],利用简单的智能体仿蚂蚁在给定的环境中随意移动。这些算法的基本原理简单懂[10],已经应用到电路设计、文本挖掘等领域。本文详细地讨现有蚁群聚类算法的基本原理与性能,在归纳总结的基础上出需要完善的地方,以推动蚁群聚类算法在更广阔的领域内到应用。2聚类概念及蚁群聚类算法一个簇是一组数据对象的集合,在同一个簇中的对象彼此类似,而不同簇中的对象彼此相异。将一组物理或抽象对象分组为类似对象组成的多个簇的过程被称为聚类。它根据数据的内在特性将数据对象划分到不同组(或簇)中。聚类的质量是基于对象相异度来评估的,相异度是根据描述对象的属性值来计算的,距离是经常采用的度量方式。聚类可用数学形式化描述为:设给定数据集X={x1,x2,…,xn},!i∈{1,2,…,n},xi={xi1,xi2,…,xip}是X的一个对象,!l∈{1,2,…,p},xil是xi对象的一个属性。根据数据的内在特性将X分解成C={C1,C2,…,Ck}。其中#ki=1Ci=X,!i,j∈{1,2,…,k},Ci≠!,Cj≠!,且(Ci∧Cj=!)(i≠j)。K={X,C}称为一个聚类空间,Ci称为聚类空间的第类(簇)。在数据挖掘中,聚类是一个活跃的研究领域[11],涉及的范围从社会学、心理学、生物学到计算机科学。存在多种聚类方法,这些方法不仅算法原理(决定运行时间及可测量性)不同,而且许多基本特性也不相同,例如处理的数据对象,有关簇形状的设想,最终划分的形式或必须提供的参数等。计算机科学家通过模仿生物行为已经提出一系列解决问题的新颖的成功方法。1991年Deneubour等介绍了基于蚂蚁的聚类和分类[9]方法,当时主要用于机器人作业调度中。后来Lumer等[8]修改了这个算法并将之应用于对数字数据分析上。者简介:张建华(1978-),男,硕士生,主要研究领域为聚类分析,算法分析与设计。江贺(1980-),男,博士,讲师,主要研究领域为分布式算法设计,无线传感器网络路由,数据挖掘等。张宪超(1971-),男,博士,副教授,主要研究领域为组合优化,算法分析与设计,并行分布式计算等。蚁群聚类算法综述张建华1,2江贺1张宪超11(大连理工大学软件学院,大连116621)2(阜阳师范学院计算机系,安徽阜阳236032)E-mail:jianhuazhang2008@摘要数据聚类是重要的数据挖掘技术,在工程和技术等领域具有广泛的应用背景。蚁群算法作为一种新型的优化方法,具有很强的鲁棒性和适应性。文章着重介绍蚁群聚类算法的研究情况,阐述当今流行的蚁群聚类算法的基本原理及其特性,旨在为蚁群聚类算法的发展提供引导作用。关键词数据挖掘蚁群算法聚类文章编号1002-8331-(2006)16-0171-04文献标识码A中图分类号TP301SurveyofAntColonyClusteringAlgorithmsZhangJianhua1,2JiangHe1ZhangXianchao11(SchoolofSoftware,DalianUniversityofTechnology,Dalian116621)2(puter,FuyangNormalCollege,Fuyang,Anhui236032)Abstract: