文档介绍::.工,●,’.●
靴做储:坪镢垆级醐:训月原创性声明晁暝鹿璸日学位论文使用授权声明本人郑重声明:所呈交的学位论文,是本人在导师的指导下,独立进行研究所取得的成果。除文中已经注明引用的内容外,本论文不包含任何其他个人或集体已经发表或撰写过的科研成果。对本文的研究做出重要贡献的个人和集体,均已在文中以明确方式标明。本声明的法律责任由本人承担。学位论文作者:日期:本人在导师指导下完成的论文及相关的职务作品,知识产权归属郑州大学。根据郑州大学有关保留、使用学位论文的规定,同意学校保留或向国家有关部门或机构送交论文的复印件和电子版,允许论文被查阅和借阅;本人授权郑州大学可以将本学位论文的全部或部分编入有关数据库进行检索,可以采用影印、缩印或者其他复制手段保存论文和汇编本学位论文。本人离校后发表、使用学位论文或与该学位论文直接相关的学术论文或成果时,第一署名单位仍然为郑州大学。保密论文在解密后应遵守此规定。
摘要当今社会是信息化的社会,,如何从大量数据中用非平凡的方法发现知识,已经成为信息产业界广泛关注的问题。数据挖掘可以从大量的信息中发现有用的信息和知识,因此它已成为信息时代的一个研究热点。聚类分析是数据挖掘中一个重要的研究领域,它的许多研究成果已经被广泛应用于模式识别、数据分析、图像处理、市场研究等多个领域。聚类边界分析是聚类分析的一个分支,它在聚类分析、图像检索、虚拟现实等领域中有着重要的作用。但是目前关于聚类边界点的研究才刚刚起步,并且已有的边界检测的算法存在着输出结果对输入参数高度依赖、不能准确提取多密度数据集中聚类的边界点等问题。另外,目前存在的聚类算法和边界检测算法大多数是相互独立的,没有将聚类和边界检测相融合。针对现有的边界点检测算法都需要输入参数,但在实际应用中算法的参数又难以确定这一问题,本文利用边界点自身的分布特征和劾嗉际趵自动计算出数据集的边界度阈值,提出了一种无参数边界检测算法针对现有的边界检测算法在含有任意形状、多密度聚类且不同聚类间距离较近的数据集上算法精度不高,聚类算法与边界检测算法相互分离等这些问题,本文充分利用最小生成树和三角剖分图能自然反应数据点分布特征的优点,将两者结合起来提出了一种新的基于最小生成树的聚类边界检测算法本文实现了算法,在综合数据集和真实数据集上做了大量实验,并与、等其它边界检测算法进行了比较,实验结果表明:算法均能在包含任意形状、不同大小的多密度聚类的数据集上有效地检测出边界点。其中,算法恍枰J淙肴魏参数,算法诖赜氪刂渚嗬虢辖亩嗝芏仁菁系募觳饩ǘ更高且具有聚类功能。关键字:数据挖掘聚类边界点参数自动化多密度三角剖分最小生成树甅。
甌.,瓹琣琣:痶,’,瑃甀..
籘;,瓵;琣;;..:痶,.:;
摘要⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯浴璴萃诰蛴刖劾喾治觥薏问劾啾呓缂觳馑惴ǖ难芯俊研究背景及意义⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯研究内容与思路⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.论文的组织结构⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯数据挖掘概述⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯..聚类分析综述⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯..⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯算法提出⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯基本概念⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯。边界点检测算法⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯...⋯⋯.⋯⋯⋯.⋯.⋯⋯⋯⋯.⋯⋯⋯⋯..⋯⋯⋯⋯⋯..⋯.⋯.⋯...⋯....⋯⋯.⋯⋯⋯目录
芙峒跋乱徊焦ぷ髡雇参考文献⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯论文总结⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯下一步工作⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯。
研究背景及意义级数据分析方法——数据挖掘【俊J萃诰蚴谴雍A渴葜蟹⑾钟杏眯畔⒑椭目前,随着互联网的迅猛发展,数据也正在以前所未有的速度向海量、高维方向发展。这些海量数据中隐含着很多有用的信息和知识,这些信息和知识就是资源,它们有利于我们进行各项社会活动,如诈骗检测、医疗卫生、产品控制、市场分析等。但原始的数据大多具有量大、不完全、有噪声、模糊等特点,传统数据库分析方法已无法有效地对该类数据进行分析和处理。为了改变这一现状,人们不断改进数据库技术和信息技术,最终形成了