文档介绍:学校代号: 10532
学号: G04092009
密级:公开
湖南大学工程硕士学位论文
基于网格的加权平均密度自适应
聚类算法及其应用研究
学位申请人姓名: 贺 庄
导师姓名及职称: 谭建豪教授、庄攀峰高工
培养单位: 电气与信息工程学院
专业名称: 电子与通讯工程
论文提交日期: 2012 年 11 月 30 日
论文答辩日期: 2012 年 12 月 30 日
答辩委员会主席: 张小刚 教授
The Study of the Weighted Average Density Self-adaptive
Clustering Algorithm based on Grid and Its Application
by
HE Zhuang
.(Hunan University)2007
A thesis submitted in partial satisfaction of the
Requirements for the degree of
Master of Engineering
in
Electronics and Communications Engineering
in the
Graduate School
of
Hunan University
Supervisor
Professor TAN Jianhao、 Sensor Engineer ZHUANG Panfeng
Feb., 2012
基于网格的加权平均密度自适应聚类算法及其应用研究
摘 要
聚类分析是数据挖掘领域中的一项重要内容,也是研究的热点。聚类分析能
够发现数据的内在分布,也可以作为数据预处理技术,如离群点检测等。聚类分
析被广泛用于信息检索、趋势分析、遥感图像等。
本文在深入研究聚类分析中的网格划分及边界点提取问题的基础上,提出加
权平均密度和自适应容纳阈值概念。然后以这两个概念为基础,对基于网格的密
度聚类算法的网格划分方法、聚类边界点提取方法和算法基本思想加以改进,构
造基于网格的加权平均密度自适应聚类算法。
本文的主要研究内容如下。
(1)阐述了数据挖掘含义;论述了数据挖掘所发现的知识、数据挖掘功能、
数据挖掘系统组成及其挖掘过程。在此基础上,讨论了聚类分析的基本含义、应
用要求和常用算法。分析了传统网格聚类算法和几种改进网格聚类算法的网格划
分方法、算法基本思想和各自的优缺点。
(2)根据聚类过程中网格尺度变化方式,提出了将网格划分分为均匀网格划
分、边长自适应网格划分和区域自适应网格划分的一种新的网格划分分类方法,