文档介绍:基于的分布式数据挖掘模型研究与实现摘要以达到挖掘性能的优化。传统的分布式数据挖掘模型——移动代码和世界上万事万物都在不断变化发展,计算机应用模式随着企业应用的发展也在不断变化发展。计算机应用模式在近年的发展变化过程中,经历了从集中式到分布式的这一变化路线。网格技术的出现使计算机应用模式再次走向了分布。随着信息技术的发展,各部门内部或者企业内部产生的数据量在急剧增加。爆炸式的数据增长既给企业带来了机遇同时也带来了挑战,如何从这些海量数据中发现知识,以及如何有效的发现知识是当今信息社会遇到的重大挑战。传统的集中式数据挖掘方式虽然能在一定程度上解决由数据分布带来的一些问题,但是面对海量数据,传统的集中式数据挖掘方式在挖掘性能方面越来越不能满足人们的需要。网格应用模式的出现给分布式数据挖掘带来了新的契机。本文的研究重点是环境下的分布式数据挖掘模型。分布式数据挖掘要解决的首要问题,是数据资源和计算资源的合理匹配,移动数据模型,虽然各有优点,但是都没有解决数据资源和计算资源的匹配问题,不能对分布式数据挖掘任务进行性能优化。本文提出的P停岷蟫移动代¨和移动数据模氲挠诺悖⒃擞米钚∠煨
数据挖掘任务进行任务优化分配。论文还给出了分布式数据挖掘最小响应时间模型各组成部分的预测方法以及实验结果。模型是基于网格服务的分布式数据挖掘模型,是功能以网格服务的形式进行封装,客户通过调用网格服务来完成数据挖掘任务,在第轮凶髡呖7⒘艘桓鯣P偷姆穸顺绦颉关键词:网格;分布式数据挖掘;籔模型;模型时间作为分布式数据挖掘任务分配策略,对基于多个数据集的分布式模型的简化模型。模型运用募芄顾枷耄ǚ植际绞萃诰基于的分布式数据挖掘模型研究‘迪
.甒瓻,瓹.,,琱疭甌’,
.甌,琣::籫;甌琲琩,..籫摹的分布式数据挖掘模型研究与实现
躲匙净一吼加≯罗年≯月必日日期:铆犟樵乱訣独创性声明关于论文使用授权的说明本人为获得浙江工商大学或其它教育机构的学位或证书而使用过的本学位论文作者完全了解浙江工商大学有关保留、使用学位论文本人声明所呈交的学位论文是本人在导师指导下进行的研究工作及取得的研究成果。尽我所知,除了文中特别加以标注和致谢的地方外,论文中不包含其他人已经发表或撰写过的研究成果,也不包含材料。与我一同工作的同志对本研究所做的任何贡献均已在论文中作了明确的说明并表示谢意。的规定:浙江工商大学有权保留并向国家有关部门或机构送交论文的复印件和磁盘,允许论文被查阅和借阅,可以将学位论文的全部或部分内容编入有关数据库进行检索,可以采用影印、缩印或扫描等复制手段保存、汇编学位论文,并且本人电子文档的内容和纸质论文的内容相一致。保密的学位论文在解密后也遵守此规定。
第滦髀引言网格是伴随着互联网技术而迅速发展起来的,是专门针对复杂科学计算的新型计算模式。这种计算模式是利用互联网把分散在不同地理位置的计算机组织成一个“虚拟的超级计算机渲忻刻ú斡爰扑愕募扑慊褪且桓觥敖诘恪保而整个网格是由成千上万个“节点”组成的“一张网格所以这种计算方式叫网格计算乜Mü褡橹鹄吹摹靶槟獾某都扑慊有两个优势:一是数据处理能力超强;另一个是能充分利用网上的闲置处理能力。简单地讲,网格是把整个网络整合成一台巨大的超级计算机,实现计算资源、存储资源、数据资源、信息资源、知识资源、专家资源的全面共享。任何技术的诞生都离不开社会或企业的需求,网格技术的产生也一样。信息、求,因此,企业不得不购买更多计算设备,这无形之中给企业增加了成本。而网格技术的出现,能够使企业仅通过一台普通的机就可以享受到由网格提供的无限计算能力,网格环境能够为企业解决以前由于缺乏运算资源而难以处理的问互联网主要为人们提供电子邮件、网页浏览等通信功能,网格功能则更多更强,能让人们透明地使用计算、存储资源等。网格计算己经成为下一代互联网的一个重要发展模式。目前,世界各国耘访牢V都在积极开展网格的研究。在这批研究浪潮的推动下出现了不少成果:美国军方正在研究规划“全球信息网,预计在年完成。英国政府也己经开始研制“英S氪送保孀耪酝裣钅康募哟笸度耄数据的迅速累积和人们对高性能计算的不断需求,是促使网格产生的主要原因。面对海量数据,企业发现即使使用了昂贵的超级计算机也往往不能满足计算需题,以最有效地方式使用他们的系统,满足客户要求并降低计算机资源的拥有数量和管理总成本。.格”国国家网格”世界各大公蟆⒒挂蚕嗉坦ú剂擞胪衲勘晗喾难芯考苹5苯袷澜缰饕5网格项辏篏,,取T贜内,已经完成的基于的分布式数据挖掘模型研究与实现琁,
。另外,全国还有几十所大学和研究机构己经开展各种网格研究。网格技术作为一种新