1 / 66
文档名称:

基于J2EE的数据挖掘框架与节点设计方法.pdf

格式:pdf   页数:66
下载后只包含 1 个 PDF 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

基于J2EE的数据挖掘框架与节点设计方法.pdf

上传人:banana 2014/2/17 文件大小:0 KB

下载得到文件列表

基于J2EE的数据挖掘框架与节点设计方法.pdf

文档介绍

文档介绍:天津大学
硕士学位论文
基于J2EE的数据挖掘框架与节点设计方法
姓名:刘建坤
申请学位级别:硕士
专业:管理科学与工程
指导教师:何曙光
20090501
摘要关键词:数据挖掘,节点,节点链,组件作为一种新的数据分析工具,数据挖掘的发展十分迅速。各种类型的数据集都可以作为数据挖掘的对象。面对现今越来越多的数据源和越来越大的数据量,数据挖掘能够有效地从中获取有价值的信息,并可以使人们更好地预测未来可能出现的数据信息,从而提高工作效率。随着挖掘算法研究的日益成熟,对数据挖掘应用的研究自然成为当前的新兴热点。然而当前对数据挖掘应用的研究大部分集中在整体的框架设计及基于新技术的数据挖掘应用上,而几乎没有探讨独立组件的设计方式。本文在对数据挖掘的一般过程及相关算法进行分析的基础上,提出了一种基于组件技术的通用的数据挖掘系统框架。在此框架各模块对应组件的设计思路上,提出了一种扩展性更好、耦合度更低的设计方式。文中借鉴并扩展了中节点的设计形式,并对挖掘过程进行了有效的分解与重组,从而将整个过程良好地节点化。在挖掘流程的表达上,通过使用组合若干挖掘节点为节点链的方式有效地降低了系统的耦合性,并在此基础上提出了基于挖掘主题的组织方式。最后,文中还较深入地研究了数据挖掘中经验和知识的复用,并提出了几种逐次过渡的复用方式。
篋甒器辸.,,琩.,.,鎒瓾,.琣吐..,甀琤,,瓼,.,
学位论文作者签名:勿I签字日期:穑甓嘣翵曰学位论文作者签名:参炅签字日期:力帕甓嘣独创性声明学位论文版权使用授权书或撰写过的研究成果,也不包含为获得鑫鲞态鲎或其他教育机构的学位或证本学位论文作者完全了解叁鲞盘堂有关保留、使用学位论文的规定。特授权丕鲞盘鲎可以将学位论文的全部或部分内容编入有关数据库进行检研究成果,除了文中特别加以标注和致谢之处外,论文中不包含其他人已经发表C艿难宦畚脑诮饷芎笫视帽臼谌ㄋ得本人声明所呈交的学位论文是本人在导师指导下进行的研究工作和取得的书而使用过的材料。与我一同工作的同志对本研究所做的任何贡献均已在论文中作了明确的说明并表示了谢意。索,并采用影印、缩印或扫描等复制手段保存、汇编以供查阅和借阅。同意学校向国家有关部门或机构送交论文的复印件和磁盘。导师签名:签字日期:年月日
选题背景及研究意义第一章绪论然而面对日益膨胀的数据,人们越来越失去了对数据的理解能力——巨大的随着信息技术的日益发展,人类己经具有了前所未有的收集数据和存储数据的能力。数据以各种方式产生并堆积起来:企业中的关系数据库记录着企业的所有日常业务;零售企业的系统用以计的数据记录人们的每一笔购买记录;炯锹剂朔梦收叩拿恳淮蔚慊鳎蝗嗣窃谌粘I钪形成的大量文本牡怠⒂始和媒体数据艉屯枷;股票交易系统每时每刻都在生成的大量的交易信息和价格信息;气象卫星传回的图像数据规模甚至达到级。为此己经开始建立巨大的数据仓库来把所有数据进行整合并集中存储起来。.数据量使人们无从下手,大量信息在带来方便的同时也带来了一大堆问题【俊!笆据丰富而知识贫乏”的情况日益凸显。随着数据库技术【俊⑷斯ぶ悄躥和数理统计等技术的发展与融合,数据挖掘,简称际酢。应运而生。它通过“智能地”和“自动地”分析数据,找到隐藏在数据表面下的知识,力图使人们摆脱“知识瓶颈”的困境。从年数据挖掘概念提出到目前为止,数据挖掘技术在理论和应用上都己经得到了巨大的发展。目前数据发掘能够从关系数据、对象关系数据、文本数据、多媒体数据、时间序列、空间数据、异质数据等多种数据源中挖掘知识。数据挖掘知识有特征、区分、关联、分类、聚集、趋势、偏差和异常监测等多种类型。数据挖掘采用的技术包括数据库、数据仓库和、统计、机器学习、可视化、神经网络等不同领域的技术,并且在诸如零售、通信、银行、保险、基因分析、股票市场分析、诰虻炔煌幸档玫搅擞τ谩随着数据挖掘算法研究的日益成熟,对数据挖掘应用的研究日益成为研究的热点。目前,已经有不少学者对数据挖掘框架及特殊领域的应用作了相关研究,主要有基于服务的框架【俊⒚嫦蚨韵蟮目蚣堋挖掘框架【取4送猓孀计算机新技术的发展,在网格方面也有关于数据挖掘的诸多研究】,在岸嗉洞怼可弦灿薪洗蠼埂H欢庑┭芯均是针对数据挖掘的整个过程进行的,较少涉及到其中组件的设计思路,本文就是由此出发进行研究的。
本文的内容及组织结构通过对数据挖掘的通用框架进行研究,可以更加深入地了解数据挖掘的过程及功能;文中提出的新的组件设计思路、节点化设计方式及挖掘过程的节点链表达形式对于构建通用框架有很强的指导意义与实践意义;而且本文提出的基于挖掘主题的组织形式及挖掘复用的过渡方式符合数据挖掘智慧金字塔的表现形式。此外,本文所做的研究也可与其他研究成果融合在一起共同构建强健的通用的数据挖掘工具,在实际应用上有较大的发展前景。本文