文档介绍:河南大学
硕士学位论文
改进的蚁群聚类分析算法的研究
姓名:王慧
申请学位级别:硕士
专业:应用数学
指导教师:陈志国
20090501
摘要数据聚类是重要的数据挖掘技术,是人们认识和探索事物之间内在联系的有信息,也可以作为其它数据挖掘算法的预处理步骤,且在工程和技术领域具有广泛的应用背景。近几十年来,国内外的研究者们提出了许多聚类算法,力图发现最优方案。随着蚁群算法研究的兴起,人们发现在某些方面采用蚁群模型进行聚类更加接近实际的聚类问题。本文首先分析了聚类分析和蚁群算法。聚类分析是数据挖掘中的一个很对聚类分析的定义、聚类的方法、数据类型以及聚类结果的度量标准作了简要的介绍。蚁群算法模拟了群体智能,在解决优化处理方面发挥了很好的作用,研究了蚁群聚类分析基本模型和蚁群聚类分析基本模型的算法,分析了其算法的优缺点。本文对基于蚁群算法的聚类分析方法及其应用展开了研究,主要工作如下:⑻岢隽嘶谛畔⑺氐母慕腖惴。由于算法要设置很多的参数,并且对参数设置比较敏感,同时由于定义了蚂蚁在二维网格中是任意移动的,任意移动过程中对某些区域并没有数据对象,而且算法收敛速度过慢,所以算法的聚类效果不好、效率不高。通过在改进算法中群体相似度函数,加入参数的自适应调整策略,利用短期记忆和网格信息素的局部分布控制蚂蚁的随机移动,并结合蚂蚁速度动态变化、半径递增、强制放下等特性,提出了基于信息素的改进的算法。⒍愿慕乃惴ń蟹治觯⑶彝ü馐允莺筒煌乃惴ń辛硕员仁笛分析,证明了改进算法的有效性,算法显示出了较高的稳定性和准确率。⑻岢隽艘先壕劾辔牡低诰蛳低辰峁埂T诘湫偷奈牡低诰蛄鞒袒∩希治和设计了蚁群聚类文档挖掘总体结构和文档分词子系统、文档特征向量计算子系河南大学研究生硕士学位论文第效手段,它既可以作为独立的数据挖掘工具,发现数据库中数据分布的一些深入活跃的研究领域,主要用于在隐含的数据中发现有意义的数据分布和数据模式。
。关键词:数据挖掘;蚁群算法;聚类分析;算法第页河南大学研究生硕士学位论文
·甒,,瓹,琩琁,猟猼...甀瑀,:甃瓵瑃,
琓河南大学研究生硕士学位论文第页,;,,..,瑃.:籆;
卑氯物努竺&⒁曷畚牡囊G螅春幽洗笱в腥ㄏ蚬学术发展和进行学术交流等目的。。可塔采取影印、缩印、扫描和拷贝等复制手本人向河南大学提出硕士学位中请。本人郑重声明:所呈交的学位论文是本人在导师的指导下独立完成的,对所研究的课题有新的见解。据我所知,除丈中特别加以说明、标注和致谢的地方外,论文中不包括其他人已经发表或撰写过的研究成果,也不包括其他人为获得任何教育、科研机构的学位或证书而使用过的材料。与我一同工作的同事对本研究所做的任何贡献均已在论文中作了明确的说明并表示了谢意。学位申请人宦畚淖髡荟名:本人经河南大学审核茸际诟伤妒垦ё W魑Q宦畚目嶙髡撸救送耆图书馆、科研信息机构、数据收集机构和本校图书馆等提供学位论文街饰本和电子文本怨┕诩焖鳌⒉樵摹1荆耄菏阼缀渝榇笱С鲇谛铩⒄估姥段保存、汇编学位论文街饰谋竞偷缱游谋。婕氨C苣谌莸难宦畚脑诮饷芎笫视帽臼谌ㄊ学毫⒒竦谜学位论文作者拭学位论文指导教师签名
第一章绪论弟一早三百研究背景理论以及计算科学,开发出了一种新的方法一数据挖掘来解决这一难题。数据挖数据收集和存储技术的快速发展使得各组织机构可以用来存储所产生的海量数据,比如金融行业每天的巨额交易数据,企业运作和销售的详细情况,地球轨道卫星发送回地球的遥感数据和高分辨率图象,人类对于越来越多的有机体所做的基因组实验产生的结构、序列和机能数据。但是,有用的信息在减少,人们被大量的数据所包围着,而这些数据却往往隐含着丰富的信息,怎样在这些数据集中寻找模式、异常值和趋势,并且用简单的数据模型进行归纳,即把数据转化为信息、将信息转换成知识,就成为了当今信息时代的巨大挑战之一。鉴于此,人们进行了有意义的探索,通过有机的结合统计学、数据库技术、机器学习、信息掘叫是一种将传统的数据分析方法与处理复杂数据的算法相结合的技术,它能将计算机程序自动遍历数据集,来发现有意义的模式和规则。数据挖掘的目标是从类、概念描述和异常检测,它为探查和分析新的数据类型以及用新方法分析原有数据类型提供了很好的机会,并且显示出了前所未有的强大生命力。从世纪年代末期开始,数据挖掘技术逐步发展起来了。暧纸幼举行了ㄌ馓致刍帷昝拦扑慊Щ酇会议提出了数据挖掘母拍睿昶穑萃诰蜃ㄌ庠又J汲霭妗5鼻埃谕庠谡夥矫嬉丫⒈砹酥诙嗟难芯砍晒吐畚模并且开发了一大批数据挖掘软件,建立了大批的相关网站,对褪萃诰虻河南大学研究生硕士学位论文第隐含的