文档介绍:HEBEI UNIVERSITY
密级:
分类号:
学校代码:10075
学号:20091313
硕士学位论文
基于广义熵的加权模糊聚类算法研究
学位申请人:刘智斌
指导教师:李凯教授
学位类别:工学硕士
学科专业:计算机软件与理论
授予单位:河北大学
答辩日期:二〇一二年六月
Classified Index: CODE: 10075
: NO:
A Dissertation for the Degree of M. Engineering
Study of Weighting Fuzzy Clustering
Algorithm Based on Generalized
Entropy
Candidate: Liu Zhibin
Supervisor: Prof. Li Kai
Academic Degree Applied for: Master of Engineering
Specialty: Computer Software and Theory
University: Hebei University
Date of Oral Examination: June, 2012
摘要
摘要
熵模糊聚类是将模糊聚类与熵进行有机结合的一种方法,它不仅具有熵表示数据样
本间相关信息的优点,而且具有模糊聚类方法中软聚类的优质特性,因而在聚类划分领
域占有重要的地位。通过对熵模糊聚类算法进行分析,并结合广义熵、样本权值以及核
函数,本文对模糊聚类划分方法进行了深入的研究,具体内容如下:
(1)通过对数据样本进行加权,并将其与广义熵模糊聚类划分方法有机结合,获
得了加权广义熵模糊聚类划分方法的目标函数;在此基础上,通过使用拉格朗日方法导
出了加权广义熵模糊聚类划分方法中的模糊隶属度和簇中心的迭代计算公式,从而提出
了加权广义熵模糊聚类划分算法。另外,本文对加权广义熵模糊聚类划分算法中的权重
确定方法进行了分析研究。
(2)在加权广义熵模糊聚类划分方法的基础上,通过引入核函数,获得了基于核
的加权广义熵模糊聚类划分方法的目标函数,从理论上导出了具有核函数的加权广义熵
模糊聚类划分方法的簇中心和模糊隶属度的迭代计算公式,进一步提出了基于核的加权
广义熵模糊聚类算法。另外,本文对具有核函数的加权广义熵模糊聚类方法中所用到的
核函数的组合与构造问题进行了研究,以便使该方法能够针对不同特性的数据集构造或
选择相应的核函数,从而有效地提高数据的聚类划分效果。
(3)通过选取聚类分析中具有代表性的数据集,针对加权广义熵模糊聚类方法及
对应的核聚类方法进行了实验研究,并与传统的广义熵模糊聚类方法进行了比较,实验
表明了本文提出算法的有效性。
关键词模糊聚类熵广义熵加权样本核函数
I
Abstract
Abstract
Entropy fuzzy clustering is bination method of fuzzy clustering and entropy. It has
not only the advantages of entropy in expressing related information among the data samples
but also the characteristics of quality about soft clustering in fuzzy clustering algorithms, so it
occupies an important place in the field of data clustering. Through the analyses of entropy
fuzzy clustering algorithm, further research on fuzzy clustering method bining
generalized entropy, the weights of samples and Kernel function is done in this paper. The
specific contents are as follows:
Through weighting the data samples bining it with