文档介绍:摘要数据挖掘是计算机领域发展的热点技术之一。通过对历史积累的大量数据供基础平台,已经成为数据挖掘应用的重要内容,是解决数据挖掘广泛应用中重复建设、资源浪费问题的重要手段。据挖掘框架结构曾被提出。然而,一直没能给出详细的结构设计和具体实现方法。架、业务流程、详细功能等设计,在开发平台近年来,随着人们利用信息技术生产和收集数据的能力大幅度提高,越来越多的数据库被用于企业管理、政府办公、科学研究和工程开发等等。但是与此同时,海量数据面临着一个严重的问题:剧增的数据背后隐藏着许多重要的决策信息,如何才能更好避免“数据泛滥、知识匮乏”的现象发生,且更有效地利用这些数据为企业、政府及科研工作者提供有效的决策支持呢的有效挖掘处理,可以发现隐藏在此中的规律或模式,为决策提供支持,而这些规律或模式是不能依靠简单的数据库查询得到的,而是通过数据挖掘来实现。然而数据挖掘需求千差万别,一般企业独自构建自己的数据挖掘系统,从而出现重复建设、资源浪费的现象。因此,建立数据挖掘平台,完成数据挖掘的底层技术构建,提供算法和预处理规则的扩展接口,为企业构建个性化的数据挖掘系统提狝且桓鏊缮Ⅰ詈系亩郃网络系统,这些通过合作解决超出单个芰Φ母丛游侍狻@肕·低臣际豕菇具有可扩展性的数据挖掘平台形成了本文研究的主要内容。在数据挖掘体系结构研究领域,从宏观角度分析入手,瓵系统数本文在对基于狝的数据挖掘平台的需求分析的基础上,进行了总体框上,针对供应商选择的决策问题,进行了原型系统实验,重点解决了算法的自动创建和注册问题,完成了多个湎⒋ǖ莸墓ぷ鳌=峁砻鳎基于瓵的数据挖掘平台具有良好的可扩展性。关键词:数据挖掘;平台;籎
..,印甀痵狝瓾.,瓹甅.;;籎’,瓸簆,‘保瑃甌甤..,辍鎍恤筽,’,,:琣.Ⅱ
日捌:丝孕扬盘燕、导师签名:签名:娩盛垄己日期:皇穑:星独创性声明关于论文使用授权的说明人已经发表或撰写过的研究成果,也不包含为获得宝王些盍堂或其它教育机构本人完全了解宝工些太堂有关保留、使用学位论文的规定,即:学校有权本人声明所呈交的论文是我个人在导师指导下进行的研究工作及取得的研究成果。尽我所知,除了文中特别加以标注和致谢的地方外,论文中不包含其他的学位或证书而使用过的材料。与我一同工作的同志对本研究所做的任何贡献均已在论文中作了明确的说明并表示了谢意。保留送交论文的复印件,允许论文被查阅和借阅;学校可以公布论文的全部或部分内容,可以采用影印、缩印或其他复制手段保存论文。C艿穆畚脑诮饷芎笥ψ袷卮斯娑签名:
第滦髀课题的研究背景大帮助的低层次的、微观的功制4罅啃畔⒃诟嗣谴捶奖愕耐币泊戳业数量众多,涉及的范围极其广泛,企业组织结构各不相刚引,因此特定的数据目前,企业信息化的应用体系已经渐渐地清晰起来,企业可以通过心来对内部的运营做一个统筹的计划和实施,而用チB绻┯ι桃欢耍云诘玫秸个供应链的最优化,用ザ钥突Ы猩疃鹊墓鼗场F笠抵械男畔⑾低如和产生了大量的历史数据,这些数据对企业当前的日常经营活动看上去好像没有什么使用价值,实际其中蕴涵着对企业高层决策有着宝贵价值的重要信息,简单的将它们丢弃是很大的浪费。例如制造业企业中供应商选择的决策,目前主要采用通过经验判断进行评价的方法,带有主观性,还有小部分采用统计学的方法,需要决策人员具有较高的统计学知识,操作起来较困难。而同时在企业的,琍,,琈等系统中积攒了大量的数据,其中与供应商有关的信息很多。虽然目前的数据库系统可以高效的实现数据的录入、查询、统计等功能,但是这些功能都是对企业的宏观经营决策没有多一大堆问题:信息过量,难以消化;真假难辨;安全难以保证;形式各异,难以统一处理等。如何从庞杂的数据中得到适度的、有效的信息,并进一步将其转化为知识,从而为高层决策提供有效的支持和辅助,已经成为一个棘手的问题。数据挖掘褪窃谡飧霰尘跋虏摹J萃诰蚴峭ü邢阜治大量数据来揭示有意义的新的关系、趋势和模式的过程,帮助人们决策的工具【俊数据挖掘成为了目前决策系统中最重要的知识获取工具。但是目前国内外对数据挖掘的研究主要集中在基础理论及其应用上。理论研究侧重对算法的研究,应用系统研究注重商业数据挖掘工具的开发。算法的研究。是针对不同的挖掘任务,提出了数据挖掘的方法。每一种算法都有其自身的特点,都有一定的针对性。不同的应用领域,适用的算法不同,即使是同一挖掘任务,不同区域的数据对于算法的适用性也是不尽相同的。应用系统的研究是针对特定的企业来进行应用系统的开发,这些系统缺乏通用性。目前关于数据挖掘集成的平台的研究较少,在企业的商务智能决策中不同类型的决策问题需要利用不同的数据挖掘算法来支持,甚至一个决策问题需要整合多种算法的结果。因此为每个决策问题都开发一个数据挖掘系统是不现实的,将造成企业资源的巨大浪费。另外企挖掘系统不可能得到通用,而各个企业都开发自