1 / 72
文档名称:

基于插件架构的数据挖掘系统平台研究与设计.pdf

格式:pdf   页数:72
下载后只包含 1 个 PDF 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

基于插件架构的数据挖掘系统平台研究与设计.pdf

上传人:banana 2014/2/28 文件大小:0 KB

下载得到文件列表

基于插件架构的数据挖掘系统平台研究与设计.pdf

文档介绍

文档介绍:江苏大学
硕士学位论文
基于插件架构的数据挖掘系统平台研究与设计
姓名:陈玉坤
申请学位级别:硕士
专业:计算机应用技术
指导教师:杨鹤标
20090531
要摘据分析领域专家的,其集成的算法功能和数目固定,而且存在功能组件可扩展性较差等问题,制约了数据挖掘系统的推广应用。因此,研究具有较强的可扩展的和总结,从数据挖掘过程模型入手,着重分析了数据挖掘系统领域需求中的主要江苏大学硕士学位论文由于数据挖掘所带来的湿著的经济效益,而受到了学术界和产业界的广泛关注。目前,已经有很多数据挖掘系统得到丌发和应用,大都是针对数据挖掘和数数据挖掘系统及其集成技术,对提高数据挖掘系统的应用价值具有十分重要的理论意义和实用价值。基于插件架构的系统具有支持可扩展性的重要特性,引入插件架构方法到数据挖掘系统构建领域,将能够较好的满足该领域对扩展性方面的需求。本文基于插件架构的思想,对当前数据挖掘系统领域中既有的成果进行了较为全面的分析特征,提出了基于插件的数据挖掘系统,并从横向和纵向对系统该架构的功能扩展进行了详细的分析。结合面向对缘思想与设计模式,在捅件架构设计模型的基础上对基于该架构模裂的数据挖掘系统进行了体系结构设计,描述了该系统的工作机制,并对其核心功能包、数据对象模型、插件算法配置、数据与算法对接等主要的功能组件进行了设计。通过引入抽象:杓颇J剑饩龈鞲鲎榧目衫┱剐曰疲杓屏适合多数据源的处理以及多挖掘算法集成的适配框架。针对该框架中插件算法的封装、加载和管理等关键问题,提出了相应的解决方法。在完成系统主要功能组件的分析与设计的基础上,对课题提出的基于插件架构的数据挖掘系统平台进行了原型系统实现。该原型系统展现了基本界面结构和主要功能,通过一个实际的数据集的测试,验证了本课题提出的模型和方法,初步达到理论研究与实际应用结合之目的。关键词:数据挖掘,可扩展,架构设计模型,插件,设计模式
江苏大学硕士学位论文—瑃,.,瓾,,,瑃.,琧,琾.,ぁ.
.篋江苏大学硕士学位论文,,,—
学位论文作者签名:降蠢叶指导教师签名:彤蛾忍Ⅵ年陆谌学位论文版权使用授权书年‘月£本学位论文作者完全了解学校有关保留、使用学位论文的规定,同意学校保留并向国家有关部门或机构送交论文的复印件和电子版,允许论文被查阅和借阅。本人授权江苏大学可以将本学位论文的全部内容或部分内容编入有关数据库进行检索,可以采用影印、缩印或扫描等复制手段保存和汇编本学位论文。保密年解密后适用本授权书。口,在本学位论文属于不保密
:月叶日学位论文作者签名:妗五七专独创性声明本人郑重声明:所呈交的学位论文,是本人在导师的指导下,独立进行研究工作所取得的成果。除文中已注明引用的内容以外,本论文不包含任何其他个人或集体已经发表或撰写过的作品成果。对本文的研究做出重要贡献的个人和集体,均已在文中以明确方式标明。本人完全意识到本声明的法律结果由本人承担。
第一章绪论研究背景长。现代计算机技术与数据库技术的发展,虽然已经能够支持快速检索这些大规模的数据集。但是,面对如此的海量数据,无论从时间意义上还是空间丌销上,价值,而导致“数据爆炸而知识贫乏”的境地【。这样,。数据挖掘发展到目前的阶段,其研究重点逐渐地从方法论转向了系统应统是数据挖掘研究和应用的桥梁,对数据挖掘的推广起到非常大的作用。成的分析算法的功匕褪抗潭ǘ蚁低匙榧衫┱剐越喜睢>」芤恍┦萃诰运用;其次,大部分数据挖掘系统和数据挖掘工具不能够很好的支持数据挖掘的标准过程,使用时不能够单独完成用户的预期目标,也给用户的使用造成了诸多的挖掘结果难以理解,已经不能满足数据挖掘发展的应用需求。特别是,数据挖成技术和方法,保持系统的可扩展性和灵活性,实现对小同的数据源,不同数据江苏大学硕士学位论文随着社会信息化的快速推进,导致了各企业组织数据集存储规模呈爆炸式增这些数据分析手段还是难以应付,只是人们无法理解并有效利用这些数据隐含的能地、自动地挖掘这些遗留数据中的潜在的知识。伴随着数据挖掘技术发展,各种各样的数据挖掘系统工具便为人们解决这一难题提供了有力的手段忙,.和中的开源和商业数据挖掘系统的应用开发、运算能力、可扩展性以及分布式应用等方面,进行了详细的分析和论述,并讨论了今后数据挖掘系统的发展方向和演用,更加注重多策略知识发现和技术集成以及多学科的交叉渗透J萃诰蛳当前一些数据挖掘系统存在着以下几个方面的问题。:首先,这螳系统集工具中采用了多种数据挖掘方法,但是实际问题总是比方法多,,价格昂贵,并且有较长的学习曲线,需要有专业的知识才能够掌握的不便,不利于其的推广应用;再者,这些系统很多只是实现了多种数据挖掘算法的工具集,导致了其与实际的业务