1 / 4
文档名称:

基于概念格的空间关联规则挖掘优化.pdf

格式:pdf   页数:4
下载后只包含 1 个 PDF 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

基于概念格的空间关联规则挖掘优化.pdf

上传人:ddrdtsv015 2014/3/28 文件大小:0 KB

下载得到文件列表

基于概念格的空间关联规则挖掘优化.pdf

文档介绍

文档介绍:万方数据
基于概念格的空间关联规则挖掘优化李宏伟,陈虎,王振宇,张斌关联规则挖掘会产生大量的项集和规则,其中只有少部分是用户感兴趣和有用的,其他大部分则是冗余的或已知的。在空间数据挖掘中,这个问题随着自然界中存在的大量已知空间依赖而变得更加突出。这引起了许多研究者的关注,如陈虎等提出利用本体辅助进行基于约束的空间关联规则挖掘,为解决数据海量而知识不足的困境提供了一种可以借鉴的方法¨在菘庵校矶嗄J蕉加肽切┩ü关联性表达的空间依赖有关,但是这种模式对于发现新颖的和有用的知识毫无用处。数据库中的这种依赖主要是为了保证数据一致性和连贯性而存在的强制关系,表现为一对一或者一对多的联系,它们是地理数据的一部分,以地理本体或者数据库元模式的形式存在。通过对一个真实地理数据模式进行试验分析,证明了数据库概念模式中存在大量明显的已知空间依赖江1文将要探讨的就是寻找一种有效的方法来实现在挖掘过程中的依赖剔除,从而实现空间关联规则挖掘的优化。定义占湟览凳橇礁龅乩矶韵驛和间的一种强制的空间关系,它表明每一个对象都必须至少和一个对象曰的实例空间关联。在定性空间频繁模式挖掘的数据集中,每一冗余的或已知的。在已有的空间关联规则挖掘研究中,用户对数据库中存在的强制约束缺少考虑。本文鮫占湟览捣治文章编号:.。.摘要:关联规则挖掘会产生大量的项集和规则,其中只有少部分是用户感兴趣和有价值的,其他大部分是分析了空间数据库中的已知空间依赖,发现已有的一面算法和闭频繁项集挖掘难以消除该空间依赖,为此提出了基于概念格方法的已知空间依赖剔除策略,包括概念格中每个闭频繁节点的产生子获得方法和利用概念格产生子实现最优频繁地理模式挖掘的方法,最后通过实验验证了概念格产生子方法的有效性和优越性。关键词:空间依赖;概念格;产生子;关联规则挖掘;闭频繁项集中图分类号:文献标识码:嗦耄痡.。—...,,皿瓼,籫焦第卷第测绘科学技术学报畔⒐こ檀笱У乩砜占湫畔⒀:恍藁厝掌冢基金项目:国家自然科学基金项目。作者简介:李宏伟,男,山东诸城人,教授,博士,主要研究方向为地理本体论及其应用。:琽。,瓵甌產,簊籆;.‘’
万方数据
行是某一个对象的实例,每一列是个谓词集,这些间谓词。在空间关联规则挖掘中,集合,五,⋯工且桓龇强占涫粜院涂占湮酱实募希数据集哕对应目标要素的实例集,其中每一个实例形也是一个集合且形∈1是一个空间关联规则挖掘的数据子集实例,每一行表示一个县,间谓词,硎緄琀表示琋表示该实例中存在一个空间依赖尺与从谢鸪嫡必有铁路穿过,表示为项集琑利用频繁模式挖掘算法对表心谌萁型掘,得到图中个频繁项集,其中有许多冗余的项集尺,日,Ⅳ蕒眨簦珻,而且有个灰色背景的频繁模式包含已知的空间依赖。可以看出,空间依赖最开始出现在频繁项集校孀牌渎阒С侄榷欢侠┥⒌礁呶项集中去。对于冗余的项集,常利用闭频繁项集方法∞圳来剔除,得到图中表示的个闭频繁项集。对比于图中个项集,有个频繁项集被剔除。虽然包含有空间依赖的频繁项集数从黾跎俚个,但空间依赖琑廊淮在于闭频繁项集中。同时,用户并不能在数据集中直接剔除空间依赖,因为尺或还与其他的空间谓词有关联;用户也不能直接剔除蛘撸畇,因为空间依赖是单向的,可以说存在火车站就肯定存在铁路,反之则并不成立,如表惺道。通过上述分析可知,闭频繁项集挖掘能够剔除冗余的频繁项集,得到