文档介绍:摘要数据分类一直是数据挖掘领域中的一个重要分支,随着信息技术和互联网的飞速发展,传统的方法已经不能满足人们的需要。蚁群算法是近年来一种新兴的群智能算法,在解决大规模组合优化问题中取得很好的效果,并在数据分类的解决中表现出了很好的发展潜力,具有广阔的发展前景。然而,现有蚁群算法的内在机制存在不足,限制了其性能的充分发挥。因此,提高数据分类应用中的蚁群算法性能,具有很强的理论和现实本文首先对侍夂褪莘掷嗟墓嬖蛱崛」探辛硕员妊芯浚⒗肨问题模型来建立数据分类的数学模型,然后通过蚁群算法对模型进行处理,得到数据分类所要提取的规则。在此过程中,本文分析了现有蚁群算法在内在机制方面的不足并进行了改进。本文的创新工作主要包括:⒄攵砸先旱摹敖印毙вΓ岢隽恕肮毕妆摺钡母拍睿⒕荽艘搿肮毕缀对蚂蚁的选择策略进行改进,使得蚂蚁能够具有更全面的全局认识;⒔ā肮毕缀庇τ玫叫畔⑺仄交浦校沟盟惴ㄔ诮咏樟驳那榭鱿露地根据“贡献”大小对信息素含量进行更新,保证了搜索空间的多样性,进而提高了算⒄攵砸先貉≡癫呗缘摹懊つ啃浴彼贾碌乃惴ǖ托侍猓搿靶畔⒍巍保得算法在不降低解的质量的前提下,动态降低搜索空间的维度,提高了算法的性能。最后,本文实现了蚁群算法解决侍夂褪莘掷嗟脑拖低常⒁源宋;《改迸算法进行了性能测试。实验结果表明,相对于和惴ǎ疚牡母慕算法提取出的分类规则能够更精确地预测未知分类的数据,并且分类规则更简单、更易关键词:蚁群算法;数据分类;还毕缀意义。法对全局最优解的获取能力:理解。大连理工大学硕士学位论文
知识水坝为您整理
.珹瑃畁“譪,‘‘“”.琤基于改进蚁群算法的数据分类研究,甌,..’’”籇,.珹痠甆琲,甌甌”皊.’黷琣瓺癰眔眞瑃;籆
知识水坝为您整理
作者签名:邀蛊丝日期:鲨:独创性说明作者郑重声明:本硕士学位论文是我个人在导师指导下进行的研究工作及取得研究成果。尽我所知,除了文中特别加以标注和致谢的地方外,论文中不包含其他人已经发表或撰写的研究成果,也不包含为获得大连理工大学或者其他单位的学位或证书所使用过的材料。。
邈到盔丝娑辍辉律先大连理工大学学位论文版权使用授权书本学位论文作者及指导教师完全了解“大连理工大学硕士、博士学位论文版权使用规定”,同意大连理工大学保留并向国家有关部门或机构送交学位论文的复印件和电子版,允许论文被查阅和借阅。本人授权大连理工大学可以将本学位论文的全部或部分内容编入有关数据库进行检索,也可采用影印、缩诨蛏璧雀粗剖侄伪4婧突惚嘌宦导师签名文。作者签名大连理二笱妒垦芯可宦畚
问题的提出从上世纪年代以来,随着互联网和信息技术的大规模普及和应用,特别是数据库技术的迅猛发展,教育、商业、工业、科学研究、医疗保健等各行各业所产生的数据量正呈现出一种指数增长的趋势。虽然人们已经可以非常方便的获取和存储大量的数据,但是在面对海量数据的时候,人们往往不能够再利用传统的信息处理、分析工具对所获得的数据之间的内在关系和一些隐含的信息进行深入的探索,例如利用管理信息系统对数据进行简单的查询、统计等。海量数据带来的不仅仅是越来越复杂的信息处理过程和冗长的处理周期,还造成了“丰富的数据,贫乏的信息”这一局面。人们对于能够智能地、自动地把数据转化成有用的信息或知识的技术和工具的迫切需求,促使了数据挖掘技术的诞生和发展。如何从大量的数据中提取出潜在的、隐藏的规则,并用其来发现有用的、准确的、可理解的信息,已经成为了当今数据挖掘和信息论领域中的热点问数据分类是数据挖掘领域中的一种重要的分析手段【浚ü崛〕鱿钟惺葜械规则来描述数据的类别,并以此来预测未知的数据和信息。数据分类的目的就是从一堆事务或对象当中判断出某一事物或对象的类别。特别是在当今数据量庞大的网络信息时代,数据分类的重要性愈加突出。人们可以利用数据分类工具对海量的数据进行处理,从中提取出有助于决策的信息和知识,从而使得人们减轻甚至摆脱“信息贫乏”的窘境。在现实世界中,人们每时每刻都对出现在周围的事务进行着分类,并且根据分类的结果进行判断。但是,人们判断所依赖的规则大多数来自人们的对事务的常识性认识和积累的经验知识,其本质是一个不断归纳学习的过程。在数据挖掘领域中,人们把数据ㄒ逦R桓龃酉钟械拇欣啾鸬氖菁醒罢彝焕啾鹗的共同特征,并以此将它们进行区分的过程【”。数据分类的解决一般分为分类模型的构建和分类模型的使用两个阶段:在模型构建阶段,为每个类别产生一个相对应数据集的准确描述或规则,其核心内容是分类算法;在模型使用阶段,利用提取出的类别描述或规则对未知类别的数据进行分类。本文主要研究分类问题的模型构造阶段。尽管数据分类在理论和技术方面已经取得了一定的突破,但是它仍然面临很多问题⒎掷嗨惴ǖ淖既沸院陀行题之一。