文档介绍:江南大学
硕士学位论文
基于XML的信息管理系统的数据集成技术研究
姓名:翟学敏
申请学位级别:硕士
专业:计算机应用技术
指导教师:刘渊
20080601
摘要一个重要标准,诘缱由涛瘛⑹萁换弧⒖蒲荼硎尽⑹萁S胨阉饕娴攘域有着广泛的应用,其作用已深入到网络社区的每个角落;而且当前数据库的发展呈现三个主要特征:支持莞袷剑哂猩桃抵悄埽С諷竦枷蚣芄。随着大速度慢等特征,采用启发式方法,结合虢峁够奶氐悖W铀惴ㄓ胍先核惴ㄈ随着际跫捌溆τ玫目焖俜⒄梗琗已经成为互联网上信息表示和数据交换的量莸挠肯钟氪ǖ荩硕訶数据管理的需求,因此如何有效地表示、存储、管理、查询与挖掘这些莼蚴萘饕殉晌5鼻癤数据库领域中一个重要挑战,具有十分重要的理论和应用价值,本文正是基于此背景研究葜悄芄芾淼摹本文围绕荩萘鞯谋泶铩⒉檠途奂任侍庹箍Q芯浚芯磕谌莺腿〉的成果主要体现在数据智能清洗与查询方面:数据清洗是提高数据质量、并提高数据查询效率的一种有效手段。随着互联网的发展,葜悄芮逑从氩檠闹匾P灾鸾ノH嗣撬鲜叮徽攵砸酝鵛数据清洗检测繁锁及灵活性差的缺陷,本文尝试通过合理组合⑷谌肓W尤核惴ā⑼ü贝叶斯学习方法及隐马尔可夫模型信息抽取策略构建萸逑垂痰脑J菽P停综合清洗结构化数据中相似重复记录的思想,提出一种利用粒子群算法改进萸洗的新方法;同时引入群智能算法提高莶檠闹悄苄杂胗行裕乇鹗橇W尤算法具有快速随机的全局搜索能力,但无法利用反馈信息,而蚁群算法通过信息素的累积和更新收敛于最优路径上,具有分布式并行全局搜索能力,但初期信息素匮乏,求解入于怕什檠希⒔邢嘤Φ母慕捎昧W尤核惴ǹ焖偕尚畔⑺胤植迹蚁群算法精确求解,达到优势互补,提高数据查询的范围和收敛的效率。关键词:粒子群算法;蚁群算法;信息素;路径离散;怕什檠籜文档集;皇萸逑矗灰矶煞蚰P汀摘要
琩,,輙琗琗甅瓵,,琱。;琫籜籜瑃瑃’瑃琲琤,琾琣:籄;籔籜;琩,:./,;瑂,疆,籔;
签名:建堡起导师签名:主【名:,除了文中特别加以标注和致谢的地方外,论文中不包含其他人已经发表或撰写过的研究成果,、使用学位论文的规定:江南大学有权保留并向国家有关部门或机构送交论文的复印件和磁盘,允许论文被查阅和借阅,可以将学位论文的全部或部分内容编入有关数据库进行检索,可以采用影印、缩印或扫描等复制手段保存、汇编学位论文,:‘:期:日
分类与查询优化算法,对萁锌焖俜掷唷⒂行Р檠庑┒际堑鼻吧綥研究第一章绪论课题来源新的发展方向。:一种包含计算的方法,它们显示出有学习或处理新情况的能力,从而使系统具有一种或集中推理功能,如泛化、回复、联的显著优势:它是一种自描述的语言,具有平台无关性、可读性、自我描述、标准化支法,如前缀编码、区间编码【、二叉树编码、肪恫檠’康龋钦庑┓椒ǘ贾的研究无疑为研究南喙夭僮鞔蚩A朔奖阒拧K淙蝗褐悄艿南喙匮芯吭缂捍嬖冢目前信息技术发展的一个重要方向就是智能化,这个目标的实现,将对人类社会的各个领域产生不可估量的影响。葜悄艽砑际跻步荴数据研究的一个想和抽象等。,无论是生物智能还是机器智能,计算智能都是最核心的部分,而符号智能则是最外层【随着网络的发展带动,魑6嘀质菰吹慕换恢行暮投嘀质菰吹募梢踩益变得成熟,丫晌M缟闲畔⒚枋龊托畔⒔换坏谋曜肌U庵饕T从赬如下持、快速部署、低廉维护等优点,便于扩充和解析;但灿胁豢珊雎缘娜钡悖何档太大,有时标注多于数据,其查询、索引技术与普通数据库的操作技术有许多异处,需要耗费更多的资源,因此这些不足又阻碍着慕徊焦惴河τ谩针对牡档谋昙侨哂喽斐赏绱涞牡托剩M芾没蛏杓埔桓鲇行的编码规则,能够较好的预处理和归约荩⒍哉庑┦萁型缰悄懿僮鳎同时针对牡到洗蠹坝肫胀ㄊ菘馐莶煌牟檠绞剑M苌杓屏榛畹木奂中一个迫切需要解决的问题。目前,已经提出了一些针对萁醒顾跤氩檠能解决问题的一个方面或只针对特定环境,这与7判缘囊G蠡褂泻艹ひ欢尉嗬耄因此借助群智能相关方法扩展δ芫统晌1究翁庋芯康闹饕K悸贰6鼻叭褐悄比如基于神经网络的智能理论已经发展了几十年,到目前为止也取得了许多重要的结果,但群智能作为一个理论被正式提出,并掀起高潮则是由学者在年提出著名的蚁群最优化,坷砺劭J嫉模辏琄等学者提出粒子群钣化算法【浚撕笕褐悄苎芯垦杆僬箍#⑷〉昧艘恍┳吭降某删汀这主要得益于群智能如下的特点:灵活性