文档介绍:论文评阅人——论文答辩日期一雄皇上颦一≯年..勉生£旦迦旦硕士研究生指导教师学科专业论文提交日期答辩委员会主席
签字日期:∥年阳夕日学位论文作者签名:锄『辍隆喝双从重庆邮电太堂有关保留、使用学位论文的规定,和借阅。本人授权重麽整电太堂可以将学位论文的全部或部分内容编入有关本学位论文作者完全了解有权保留并向国家有关部门或机构送交论文的复印件和磁盘,允许论文被查阅数据库进行检索,可以采用影印、缩印或扫描等复制手段保存、汇编学位论文。C艿难宦畚脑诮饷芎笫视帽臼谌ㄊ导师签名:签字日期:./
摘要值选取方法一一选择差值法。该方法充分考虑了数据的物理特性,能自动聚类分析是智能信息处理、数据挖掘、模式识别等研究方向的重要研究内容之一,在识别数据的内在结构方面具有重要作用。大多数聚类算法都需要预先给出参数,如聚类数目、聚类中心点或迭代次数等。事实上,如果没有相关知识和经验,这在多数情况下是不可行的。因此,为了减少人为干扰因素,本文基于决策粗糙集模型进行了自动聚类的研究。和忍岢龅拿嫦蛑J甇聚类算法,通过结合层次聚类算法和粗糙集理论,能从局部和全局的数据特性上对数据进行聚类,具有很好的聚类效果。因此,本文采用了面向知识聚类的算法框架进行自动聚类的研究。首先,针对面向知识聚类算法的初始聚类结果对用户输入的初始阈值参数敏感这一问题,本文提出了一种自动阈地得到较好的初始聚类结果。此外,本文研究发现了以往文献中定义的类类不可区分度公式的不合理性并进行了改进,新的计算方法使聚类结果更加准确。本文还对决策粗糙集模型进行了研究,提出了基于决策粗糙集的聚类模式代价评估方法,能够动态的对聚类结果进行评估,根据聚类模式的代价值的变化来制定合并策略和指导算法选择终止点;另外,新方法也自动地给出了类重叠边界区域的范围,有助于用户选择不同粒度的聚类结果。同时,本文给出了一个基于决策粗糙集的面向知识自动聚类算法,在人工数据集和标准数据集上的实验结果表明该算法是有效可行的,并且能处理类类边界重叠问题,也不需要人为阈值的设定。最后,本文将上述研究成果应用到了阉鹘峁劾嘀校抡媸验表明新方法在边界具有重叠现象的聚类中应用良好。关键词:聚类,面向知识聚类,自动聚类,决策粗糙集,代价重庆邮电大学硕士论文
甀,,畉—,瑃.
选择差值法自动获取初始阈值⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯类类不可区分度定义的改进⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯..⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯..系统主要模块功能介绍⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯...霾叽植诩P汀决策粗糙集模型的应用⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯本章小结⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.第四章基于决策粗糙集的面向知识自动聚类方法⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.基于决策粗糙集的聚类模式代价评估⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯..基于决策粗糙集的面向知识自动聚类算法⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯..⋯⋯⋯⋯⋯⋯⋯.阉鹘峁劾嗖街琛目录騦.,駆,琹.●■
研究背景及意义第一章绪论的方法和其他聚类方法。但是划分聚类往往需要预先给定聚类数目,然后近几年来,随着数据挖掘的发展,作为数据挖掘中一个重要研究领域,聚类技术也被广泛的应用到了统计学、模式识别、机器学习、信息检索、生物学以及市场营销等领域。聚类算法一般分为以下几类:层次聚类、划分聚类、基于密度和网格遵循迭代最优策略把数据划分成预先设定数目的类别;层次聚类则一般需要选择算法终止点。这两种方法虽已成功取得了广泛的应用,但他们都是依靠局部数据特性来提炼聚类模式的,都存在产生扭曲数据本身特征的风险。通过结合层次聚类算法和粗糙集理论,等提出了面向知识聚类算法,克服了传统聚类方法一些弊端,能从局部和全局的数据特性上对数据进行聚类,达到更好的聚类效果。此类算法的效果和性能很大程度上取决于初始阈值的选择,已经有很多改进的算法研究,例如,等利用物理上的质心原理来自动的获取初始的分类阈值参数。聚类效果是一个聚类算法应用到实际中需要考虑的重要方面。一个好的聚类效果评估方法会对聚类中很多参数的选取有帮助,如聚类数目。提出的决策粗糙集模型畉提供了一个更好的对分类的理解。通过调整损失函数,能构造一个聚类效果评估指数。忍岢隽艘桓龌诰霾呃泶植诩钠拦婪椒ā本文针对自动聚类展开了研究,首先,我们基于物理学理论提出了一种选择差值方法自动获得面向知识聚类算法框架中的初始阈值,避免了人为干扰因素,并减少了获取初始阈值的时间复杂度;另外,在研究面向知识聚类算法过程中,发现了类类不可区分度的定义在某些情况下不是很合理,和数据本身的特性不一致,我们改进了类类不可区分度的定义,使其更合理,能保证聚类结果更准确;然后,我们