文档介绍:分类号: 密级:
U D C: 编号:
学位论文
基于划分的谱聚类算法的研究和改进
段凤
指导教师姓名: 沈西挺教授河北工业大学
申请学位级别: 工程硕士工程领域名称: 计算机技术
论文提交日期: 2011 年 11 月论文答辩日期: 2011 年 12 月
学位授予单位:河北工业大学
答辩委员会主席:
评阅人:
2011 年 11 月
Dissertation Submitted to
Hebei University of Technology
for
The Master of Engineering Degree of
Computer Technology
THE RESEARCH AND IMPROVE OF THE PARTITION-BASED
SPECTRAL CLUSTERING ALGORITHM
By
Feng Duan
Supervisor: Prof. Shen Xiting
November 2011
原创性声明
本人郑重声明:所呈交的学位论文,是本人在导师指导下,进行研究工作所取得
的成果。除文中已经注明引用的内容外,本学位论文的研究成果不包含任何他人创作
的、已公开发表或者没有公开发表的作品的内容。对本论文所涉及的研究工作做出贡
献的其他个人和集体,均已在文中以明确方式标明。本学位论文原创性声明的法律责
任由本人承担。
学位论文作者签名: 日期:
关于学位论文版权使用授权的说明
本人完全了解河北工业大学关于收集、保存、使用学位论文的规定。同意如下各项内
容:按照学校要求提交学位论文的印刷本和电子版本;学校有权保存学位论文的印刷本和
电子版,并采用影印、缩印、扫描、数字化或其它手段保存论文;学校有权提供目录检索
以及提供本学位论文全文或者部分的阅览服务;学校有权按有关规定向国家有关部门或者
机构送交论文的复印件和电子版;在不以赢利为目的的前提下,学校可以适当复制论文的
部分或全部内容用于学术活动。
(保密的学位论文在解密后适用本授权说明)
学位论文作者签名: 日期:
导师签名: 日期:
河北工业大学工程硕士学位论文
基于划分的谱聚类算法的研究和改进
摘要
聚类分析一直是数据挖掘和机器学习中的一个很有价值的课题,关于这方面的研究也
比较多。论文主要分析了谱聚类算法的理论依据,以及谱聚类算法相对其他算法明显的优
缺点并指出了目前谱聚类算法存在的一些问题,提出了谱聚类算法的改进方法和理论基础,
论文完成了以下两个主要方面的工作。
首先,详细分析了谱聚类算法的谱图理论以及无向图的划分。通过对传统谱聚类算法
的深入分析和研究,针对谱聚类算法对初始值敏感的问题做了改进,研究目标是通过对
k-means 聚类算法进行改进,设计出对初始值不敏感的改进算法,从而避免了传统谱聚类
算法聚类结果的不稳定性。
其次,论文对改进的谱聚类算法应用于商场顾客的划分进行了研究。改进后的谱聚类
算法不但能发现任意形状的簇和收敛于全局最优解,而且为商场顾客的划分也提供了一个
新的思路。因此论文将改进的谱聚类算法用于商场顾客划分中,通过对特征顾客的聚类,
对商场的营销具有一定的指导意义。实验结果表明,改进谱聚类算法在商场顾客划分中确
实有一定的可行性。
关键词:数据挖掘,谱聚类,k-means 聚类算法,初始值敏感
i
基于划分的谱聚类算法的研究和改进
THE RESEARCH AND IMPROVE OF THE
PARTITION-BASED SPECTRAL CLUSTERING ALGORITHM
ABSTRACT
Cluster analysis has been a valuable subject in data mining and machine learning ,the
research in this area paratively more. Paper describes the theoretical basis of spectral
clustering algorithm and the obvious a