文档介绍:中国优秀硕士学位论文全文数据库 2011年 第S1期 信息科技辑
Chinese Master's Theses Full-text Database 2011, Information Science and Technology I138-1183-1
层次聚类中类间距离新定义
叶剑俊
学位授予单位: 浙江大学; 学科专业: 概率论与数理统计
摘 要
本文是在攻读硕士学位期间完成的,
背景下,
法的类间距离提供了一种新的定义方式,即通过将类作为整体,
体的实施中,运用了两个思路,一个是提取代表元,另一个是将类中所有样本作为整体进行考虑,并对每个思路
,通过对实验数据的分析,得出了较为有效的两种定义方式 PCAHC 和 VRHC.
文章的结构如下:第一章为引言部分,介绍了数据挖掘和聚类分析的研究现状和发展以及本文的研究内
,然后利用相关的理论得出了类间距离的几种新定义方
式,,通过比较分析
.
关键词:数据挖掘;;聚类;;类间距离;;特征提取;;代表元
中图分类号:
Abstract
The main subject of this dissertation is about clustering analysis, which is completed during my master degree
of science. In the background of explosive growth of available data, clustering analysis plays a more important role
in our daily life as one of important technologies of data mining. The innovation in paper is that a new method
used to determine the distance between categories in hierarchical clustering algorithms is proposed, that is,
considers each category as a whole ra