文档介绍:本学位论文作者完全了解苦≥栅关保留、使用学位论文的规定,.讥∥习�蔟戽。学位论文作者签名:锯丹丹学位论文作者签名:崔哥哥他人已经发表或撰写过的研究成果,也不包含为获得鎏辱参功鼋磐其他教育机构借阅。本人授权骞髯豁堤镑以将学位论文的全部或部分内容编入有关数据库进行独创性声明学位论文版权使用授权书签字日期:为�年厂月形日乃�年歹月≥石日本人声明所呈交的学位论文是本人在导师指导下进行的研究工作及取得的研究成果。据我所知,除了文中特别加以标注和致谢的地方外,论文中不包含其的学位或证书而使用过的材料。与我一同工作的同志对本研究所做的任何贡献均已在论文中作了明确的说明并表示谢意。签字日期:有权保留并向国家有关部门或机构送交论文的复印件和磁盘,允许论文被查阅和检索,可以采用影印、缩印或扫描等复制手段保存、汇编学位论文。�C艿难�宦畚脑诮饷芎笫视帽臼谌ㄊ�学位论文作者毕业去向:工作单位:通讯地址:导师签名:电话:邮编:
摘要���数据挖掘是一种提取出隐含在大量数据中的潜在的、有用的信息并被人们识别、处理的数据库中的知识发现����������J�萃诰蚣�术结合了模式识别、数据库、统计学、机器学习和人工智能等多个领域的一种新兴的交叉的学科技术。数据挖掘有多个研究方向,包括分类、聚类、关联规则挖掘等。聚类分析是数据挖掘领域中的一个比较热门的研究方向。聚类分析是要达到这样一种目的,将数据对象进行划分成不同的簇使得同一个簇中的数据对象具有较高的相似度,不同簇中的数据对象的相似度较低。目前为止,聚类分析算法一般有以下五种分类:基于划分的聚类算法、基于层次的聚类算法、基于密度的聚类算法、基于网格的聚类算法和基于模型的聚类方法。聚类算法在商务、市场分析、生物学以及文档分类等领域有着广泛的应用。另外,聚类算法不仅可以作为发现数据库中数据分布的深层次信息的工具,还可以作为数据挖掘中的一个预处理步骤。因此,研究聚类分析算法有着十分重要的意义。�甅��算法是基于划分的聚类算法中的一个典型算法。该聚类算法的一个最大的优点就是操作简单、采用误差平方和的准则函数、对大数据集的处理上有较高的可伸缩性和高效性。但是该算法存在着一定的缺陷:首先起初需要指定�值表示聚类个数;其次它比较敏感于聚类中心初值的选取问题;第三算法也极其容易的陷入局部的最优解;最后它只能发现球状的簇。�甅��算法采取随机选取初始聚类中心,因此,一旦聚类中心选取不当,将会得到一个不合理的聚类结果。本文针对聚类算法的结果对初始聚类中心依赖性的问题,对初始聚类中心选取的方法给出了分析与研究,并针对初始聚类中心选取的方法提出了两种新的算法。本文工作主要包括:��紫冉樯芰耸�萃诰虻难芯恳庖逵刖劾喾治龅难芯勘尘昂脱芯糠较颉����萃诰蛑械木劾喾治鏊惴ǖ难芯俊0�ㄏ钟械木劾喾治鏊惴ㄓ心男���类的概念和形式描述、聚类分析中的数据类型和数据结构、数据的标准化、聚类分析的相似度度量、聚类分析中的准则函数和聚类分析的一般步骤等。�����.
芯苛薑.���惴ǖ幕�舅枷牒驮�恚��狈治隽薑.���惴ǖ挠�缺点,研究了现有的针对�琈��算法初值选取的改进的措施。��攵訩.���惴ǘ猿踔狄览敌缘娜钡悖��隽肆街指慕�跏季劾嘀行�选取的算法,主要的研究成果和内容集中在以下两个方面:���谧�晷�5乃悸罚�攵訩.���惴ㄋ婊�≡癯跏季劾嘀行牡贾�聚类结果不稳定的情况,提出了一种基于坐标旋转的选取聚类中心的算法�俏���惴�,能够很好地用于低维数据的聚类上,并且改善了随机选择初始聚类中心致使�甅��算法陷入局部最优解而得不到正确聚类结果的情况,保证了聚类结果的准确与稳定性。��柚�芏鹊乃枷耄��谄骄�嗬氲乃悸费≡癯跏季劾嘀行模��隽薑�算法,该算法克服��惴ǖ娜钡悖�⒛芄皇钩跏贾行木】赡艿姆挚#�朔��多个聚类中心被选在同一个簇中的情况,提高了聚类的有效性,并进行了实验验关键词:聚类分析;数据挖掘;�狹��聚类算法证与分析。安徽久学��届硕�貉�宦畚��甅��聚类算法的研究与改进�
.��������������,��������;�����琽��������������,���.����������������������;����甂—���������������������瑂�����琺������.���������������琣�������畉�������,������,����猙�����猙��,�����瓹���������,��.���。������.�����琲���.���������簍�����甀�
.����.���������������甦���������������瓵���������狹�����;�甅����甌������.�甊���������琫�.��,������.����,�����甌�