1 / 60
文档名称:

聚类有效性指标结构分析及应用论文.pdf

格式:pdf   大小:2,376KB   页数:60页
下载后只包含 1 个 PDF 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

聚类有效性指标结构分析及应用论文.pdf

上传人:jd234568 2016/8/27 文件大小:2.32 MB

下载得到文件列表

聚类有效性指标结构分析及应用论文.pdf

相关文档

文档介绍

文档介绍:聚类有效性指标结构分析及应用 The structure analysis and applicationof the clustering validity index 学科专业:控制科学与工程研究生:包秀娟指导教师:岳士弘教授天津大学电气及自动化工程学院二零一四年十二月独创性声明本人声明所呈交的学位论文是本人在导师指导下进行的研究工作和取得的研究成果,除了文中特别加以标注和致谢之处外,论文中不包含其他人已经发表或撰写过的研究成果,也不包含为获得天津大学或其他教育机构的学位或证书而使用过的材料。与我一同工作的同志对本研究所做的任何贡献均已在论文中作了明确的说明并表示了谢意。学位论文作者签名: 签字日期: 年月日学位论文版权使用授权书本学位论文作者完全了解天津大学有关保留、使用学位论文的规定。特授权天津大学可以将学位论文的全部或部分内容编入有关数据库进行检索,并采用影印、缩印或扫描等复制手段保存、汇编以供查阅和借阅。同意学校向国家有关部门或机构送交论文的复印件和磁盘。(保密的学位论文在解密后适用本授权说明) 学位论文作者签名: 导师签名: 签字日期: 年月日签字日期: 年月日摘要聚类技术作为数据挖掘领域的重要分支,其目的是采用一定的手段(算法) 将数据集划分为有意义的类(或簇),使得同一类内的样本在一定的标准(或规则)下相似性较高,而不同类的样本则表现较高的相异性。目前聚类技术已经在模式识别、生物医学、工业生产等诸多领域得到广泛的应用。聚类过程的算法选择和基于聚类有效性指标的聚类结果评估是聚类过程中最为重要的步骤。目前,国内外学者针对不同的数据集结构及应用背景提出了多种不同的聚类算法,其均有一定的适用性及局限性。聚类指标的有效性评价则对一个确定的目标数据集在不同算法下的聚类结果提出了一个量化标准,有助于评估不同算法表现的优劣性或者同一算法对不同参数的敏感性。本文在现有的聚类算法和有效性指标基础上,对近些年发展起来的谱聚类算法进行了分析研究,提出了基于NJW(Ng-Jordan-Weiss)算法的聚类评价指标,用以评估聚类的类数,另外,针对电学层析成像技术,提出了依据有效性指标进行聚类算法选择的方案。在本文中,作者主要做了以下方面的工作及研究: 对现有的聚类算法和聚类有效性指标做了比较分析和分类描述,总结出若干典型聚类算法的应用背景及局限性; 对近些年发展起来的谱聚类算法做了概述,并总结了现有谱聚类算法的基本流程,在此基础上提出了基于NJW算法的聚类评价新指标,该指标在人工数据集及真实数据集的测试中均验证了可行性,聚类准确性优于已有的指标; 将聚类算法应用到了电学层析成像技术中,对样本数据集采用四种不同的算法聚类并成像,在Silhouette指标下进行了结果评价,选择出最优的聚类算法并与不同算法的重构结果进行可视化对比。证实了在电学层析聚类成像中依据有效性指标进行算法的选择是可行的和有效的。关键词: 聚类算法,有效性评价,谱聚类,电学层析成像,算法选择 ABSTRACT As an important branch in the areaof data mining,clustering technology aims to employ certain method(algorithm) to partitionanydata set into meaningful classes (or clusters), so that samples(data)within a cluster are similarin acertain standardwhilesamplesin different clusters a wide range of applications,such as the fields of pattern recognition、biological medicine、industrial production and so on. In the process of clustering, the design (selection) of the clustering algorithm and cluster validationare both very solve different problems in specific fields, at present,differentclustering algorithms havebeen proposed, buttheyall have localapplicabilitya