1 / 65
文档名称:

数据挖掘中聚类分析算法的研究与应用.pdf

格式:pdf   大小:1,727KB   页数:65页
下载后只包含 1 个 PDF 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

数据挖掘中聚类分析算法的研究与应用.pdf

上传人:莫欺少年穷 2021/11/14 文件大小:1.69 MB

下载得到文件列表

数据挖掘中聚类分析算法的研究与应用.pdf

相关文档

文档介绍

文档介绍:摘要

摘 要
随着数据的收集与存储技术的快速发展,使得目前世界上的各个组织机构可以
存储海量的数据。正是因为数据量的巨大,也使得传统的靠人工分析技术遇到了
发展瓶颈,怎样从海量数据中高效的发现有价值有意义的信息已经成为数据挖掘
的主要研究方向以及驱动其快速发展的一个重要因素。作为一个新兴的交叉学科,
聚类分析技术以其在数据挖掘过程中的独特地位以其在现实生活中的广阔应用,
使其成为目前一个十分活跃的研究方向。从目前的情况来看,所有的聚类算法几
乎都是针对特定数据对象所设计的,没有一种算法能够做到“放之四海而皆准”,
每一种聚类算法都起自身的优点和局限性。
本文在简单介绍了数据挖掘的相关知识之后,重点介绍了数据挖掘的聚类分析
方法,并且以聚类分析算法的分类为基础,详细介绍了每种聚类分析算法中的典
型聚类算法,并且给出了各种典型算法的优缺点的介绍。
在对聚类分析技术有深入了解之后对聚类分析的 DBSCAN 算法、层次聚类算法
模糊聚类分析的传递闭包算法与实际应用相结合做了若干数值试验,得出了一些
有价值的实验结果,对传统的 K-means 算法本文结合了基于密度的思想,给出了
一种改进算法,进而提高了 K-means 算法的聚类稳定性,同时给出了一种改进的
子空间聚类算法的思想,以及在选择聚类算法时应考虑的因素给了一点建议。

关键词:数据挖掘,聚类分析,模糊聚类分析
I
ABSTRACT
ABSTRACT
With the rapid development of data collection and storage technologies, making the
various organizations in the world can store vast amounts of . It is because of
the huge amount of data, making the traditional manual analysis encounter development
bottleneck, how from massive data efficiently find meaningful information data mining
has become a major research direction and drive the rapid development of an important
factor. As a new subject, clustering analysis technology in the data mining process in the
unique position to the reality of life in the broad application, so that it has become a
very active research the current situation, all the clustering algorithms
are almost always designed for a particular data object, no algorithm can do a " be
applicable everywhere", each clustering algorithm itself the advantages of and
limitations.
This paper introduces data mining knowledge. After introduced the cluster analysis
method of data mining, and the cluster analysis algorithm based on the classification,
detailed introduced each kind of clustering algori