文档介绍:西南交通大学学位论文版权使用授权书本学位论文作者完全了解学校有关保留、使用学位论文的规定,同意学校保留并向国家有关部门或机构送交论文的复印件和电子版,允许论文被查阅和借阅。本人授权西南交通大学可以将本论文的全部或部分内容编入有关数据库进行检索,可以采用影印、缩印或扫描等复印手段保存和汇编本学位论文。本学位论文属于 ,在年解密后适用本授权书; ,使用本授权书。(请在以上方框内打“√”) 学位论文作者签名: 指导老师签名: 日期:邢骷目坫a 日期:)q心午r目世日万方数据西南交通大学硕士学位论文主要工作(贡献)声明本人在学位论文中所做的主要工作或贡献如下: 1)提出基聚类器生成时机的概念,将提高集成网络问泛化能力的早期停止准则应用于聚类集成过程,设计基于早期停止准则的基聚类成员生成方法。 2)提出谱图划分集成方法时机的概念,将谱图划分集成算法依次产生的三个阶段性结果分别进行集成,依次称之为划分集成、网络集成和效用集成,,设计基于时机的(半监督) 模糊谱图划分聚类集成算法。本人郑重声明:所呈交的学位论文,是在导师指导下独立进行研究工作所得的成果。除文中已经注明引用的内容外,本论文不包含任何其他个人或集体已经发表或撰写过的研究成果。对本文的研究做出贡献的个人和集体,均已在文中作了明确说明。本人完全了解违反上述声明所引起的一切法律责任将由本人承担。学位论文作者签名:互瘫岔’日期:2口侈牵步目2乡目 I一万方数据西南交通大学硕士研究生学位论文第1页捅要聚类分析作为数据挖掘和机器学****领域重要基础技术方法之一,广泛应用于模式识别、图像分割、社会计算等诸多领域。其中,,分别从不同角度深入和展开,提出了一系列的模糊聚类新算法。聚类算法虽然多种多样,而现实世界的样本数据却具有各种结构或形状,故任何一个聚类算法都不一定能准确揭示样本数据纷繁复杂的簇结构。聚类集成适时地出现, 即将产生的多个聚类划分结果融合来得到统一且合理的聚类划分结果。近年来,许多研究表明聚类集成技术能有效提高单聚类算法的精度和稳定性,其关键问题之一在于如何将不同的聚类成员融合得到更好的聚类结果。本文提出基聚类器生成时机的概念,将提高集成网络问泛化能力的早期停止准则应用于聚类集成过程,提出基于早期停止准则的基聚类成员生成方法。同时本文提出谱图划分集成方法时机的概念,将谱图划分聚类集成算法依次产生的三个阶段性结果分别进行集成,依次称之为划分集成、网络集成、效用集成,,进而提出基于时机的(半监督)模糊谱图划分聚类集成算法。通过对基于早期停止准则的聚类集成算法和基于时机的模糊谱图划分聚类集成算法的理论分析,以及相应的实验及结果分析,可以看出:基于早期停止准则的聚类集成得到的结果较好,且更节约聚类集成的时间;基于时机的模糊谱图划分聚类集成算法相对于现有的图划分聚类集成方法,无论是聚类效果还是在执行时间上都表现不俗, 特别是基于划分集成的模糊谱图划分聚类集成算法,不仅有效去除‘噪声’,更精确地表示数据集结构,而且在执行时间上的优势也尤为突出。关键词:聚类集成;模糊聚类;谱图划分;半监督;时机万方数据西南交通大学硕士研究生学位论文第1I页 Abstract As an important basic technology method of data mining and machine learning, clustering analysis iswidely applied inpattem recognition,image segmentation,puting and other ,the scholars athome and abroad research on fuzzy clustering algorithms including thefuzzy C—means clustering algorithm from differentangles, andput forward aseriesofnew fuzzy clusteringalgorithms. Although clusteringalgorithms are various,the data inthe realworld also have a variety of structure and shape,SO any clusteringalgorithm cannot accurately reveal the structure of plex