1 / 96
文档名称:

基于蚁群算法的聚类算法研究.pdf

格式:pdf   大小:1,205KB   页数:96页
下载后只包含 1 个 PDF 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

基于蚁群算法的聚类算法研究.pdf

上传人:zhufutaobao 2021/11/4 文件大小:1.18 MB

下载得到文件列表

基于蚁群算法的聚类算法研究.pdf

文档介绍

文档介绍:摘 要
通过对蚂蚁觅食过程中总能找到一条从蚁巢到食物源的最短路径现象的数学
建模,得到一种新的算法—蚁群算法。该算法采用正反馈并行自催化机制,具有
较强的鲁棒性、优良的分布式计算机制、易于与其它算法融合的优点,对于解决
大规模复杂问题表现出了优异的性能和巨大的发展潜力。计算机的广泛使用,越
来越多的数据被产生。如何从中找出有用的、完整的、能够为未来决策其作用的
知识是一个巨大的挑战。聚类分析总为数据挖掘的重要研究领域之一,具有极其
重要的作用和地位。它能根据数据的属性对其进行分组和归类。聚类分析使得同
一类中的数据具有最大相似性,不同类中的元素具有最大向异性。
本文首先对聚类分析进行了详细总结和介绍,分析和总结了目前流行聚类算法
的优缺点;同时介绍了聚类分析中的数据表示、相似性度量准则等内容。随后,
对蚁群算法进行了详细的介绍,分析和总结了目前应用于聚类分析中的两种模型:
基于蚁堆原理和基于蚂蚁觅食行为原理。本文的重点是提出了一种新的蚁群聚类
算法,它利用 R 只蚂蚁来求解,每只蚂蚁在开始的时候均分配一个空的串 S ,该 串
的大小为 N 。串 S 中的数值表示相应的元素被分配到的具体的哪个类。将类中心
和元素分别看作是食物源和蚁巢,蚂蚁根据信息素矩阵的值进行类标识分配。为
了避免陷入局部最优,一次迭代之后,采用局部搜索技术来试图跳出局部最优。
反复重复上述步骤,最终得到预期的解。
为了验证本文算法的有效性和优越性,文中引入遗传算法、模拟退火算法和禁
忌搜索算法来进行比较实验,实验中采用两个模拟数据集和三个 UCI 中的数据集。
实验结果表明,本文提出的蚁群聚类算法要优于其它三种随机算法。
随着 Web 站点自身信息越来越丰富和结构越来越复杂,目前信息服务中普遍
存在着“信息过载”和“资源迷向”的状况,不同的用户有不同的访问目的。因
此,将蚁群聚类算法应用于 Web 日志挖掘,实现网站的自适应,既把从日志数据
中提取的知识转换为站点的只能,使其为用户提供更有效的服务。为此,本文设
计并实现了一个自适应网站的原型系统,从而验证了运用相关技术实现网站自适
应是可行的。
I
本文最后对所有工作进行了总结,并对未来工作进行了展望。

关键词:蚁群算法,数据挖掘,聚类分析,蚁群聚类算法
II
ABSTRACT
Through modeling the ant can always find the shortest path from their nest and
food by mathematical method, we can obtain a new algorithms – ant colony algorithm.
This algorithm has several virtues such as positive feedback and parallel mechanism,
preferable robusticity, distributed computing, and easy combination with other methods.
And presents outstanding performance and huge development potential in solve
complex problems.
With increasing use of computers, tremendous volumes of data have filled hard
disks as digitized information. In the presence of the huge amount of data, the challenge
is how to truly understand, integrate, and apply various methods to discover and utilized
knowledge from these data. To predict future trends and to make better decisions in
science, industr