1 / 50
文档名称:

基于星型模式的top k join算法研究.docx

格式:docx   大小:497KB   页数:50页
下载后只包含 1 个 DOCX 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

基于星型模式的top k join算法研究.docx

上传人:wz_198613 2018/5/15 文件大小:497 KB

下载得到文件列表

基于星型模式的top k join算法研究.docx

相关文档

文档介绍

文档介绍:摘 要
top-k join 查询返回用户最感兴趣的 k 个连接结果。近来 top-k join 已经成为一个重要的研究课题,其在 Web 数据库,信息抽取和数据挖掘中均有应用。星型模式的数据仓库在实际应用中也存在 top-k join 查询,如有时决策者只想查询星型连接结果中他最感兴趣的 k 个。然而,现有 top-k join 算法不适合星型模式。为了在星型模式上有效地支持 top-k join 查询,本文提出两种索引并基于这两种索引提出一个适用于星型模式的多路 top-k join 算法 MTJS。该算法通过采用一个比现有算法更优的上界和一个剪枝策略获得了更高的效率。此外,实验也表明该算法比现有算法效率更高。
获取精确的 top-k join 查询结果的代价是较高的,而且有时决策者希望牺牲 top-k join 查询结果的精确性来缩短查询的执行时间和资源消耗。更重要的是, 我们发现现有的近似 top-k join 算法因没有充分考虑星型模式的固有特点而不适合星型模式, 因而本文提出一个基于星型模式的近似多路 top-k join 算法 MT JS- e 。 MTJS - e 是 MTJS 的一个变种算法,其通过引入一个参数ε来返回近似的 top-k join 结果。MTJS - e 因使用了 MTJS 中的总上界和剪枝策略等优化, 其性能优于现有近似的 top-k join 算法。此外,我们通过实验证明了 MTJS - e 的效率优于现有算法。而且还发现 MTJS - e 返回的结果的实际精确程度远远优于其近似度定义的精确程度。
关键词:数据仓库;星型模式;多路 top-k join 算法
Abstract
Top-k join query returns k join results that users are most interested in. Top -k join has e one of the main research issues recently, and it’s dominant in many applications, for example, data mining, web databases and information retrieval. Top-k join query also exists in data warehouse based on the star schema in practical application. For example, sometimes just the top-k join results that the decision maker is most interested in are desirable. However, the current existing algorithms aren’t suitable for the data warehouse based on the star schema. In order to efficiently support top-k join query on star schema, we propose two kinds of indices and a multiple top-k join algorithm that is suitable for star schema based on these indices. By using a tighter upper bound than current existing algorithms and a pruning strategy, the algorithm is more efficient than the current existing algorithms. Furthermore, the experiment also shows that our algorithm is more efficient than the current existing algorithm.
MTJS is the exact top-k join algorithm. However, obtaining the exact top-k join query results leads to an expensive cost, and sometimes the decision maker is willing to sacrifice the accuracy of the top-k join query results to reduce the execution time of

最近更新

国庆节趣事100字作文(精选35篇) 11页

四季之美小学作文(通用28篇) 24页

员工上半年工作总结(通用15篇) 20页

卫生院高质量发展服务方案(精选3篇) 24页

包工包料建房合同范本(精选10篇) 22页

办公管理制度(精选19篇) 53页

分享快乐的六年级作文600字(通用59篇) 53页

冬奥会闭幕式再见北京作文(通用40篇) 35页

写给公司感谢信范文集锦7篇 7页

关于说明文的作文集锦6篇 6页

关于竞选大队长演讲稿范文最新5篇 5页

关于环卫演讲稿2篇 3页

关于梦想的朗诵稿15篇 19页

幼儿园园长的工作心得与经验分享(模板23篇).. 43页

关于劳动的古诗(合集8篇) 22页

关于公开课后的教学反思(精选5篇) 6页

关于中秋佳节的作文集锦10篇 9页

公司人员辞职报告范文15篇 11页

元旦晚会主持人简短开场白范文(精选5篇) 5页

儿子婚礼上父亲致辞(精选20篇) 16页

保险公司演讲稿(通用15篇) 27页

优秀班主任代表发言稿范文(通用20篇) 51页

差错控制与信道编码 92页

交通安全主题教案《交通安全》(精选8篇) 16页

2025年人教新目标英语七年级下册词汇专项练习.. 5页

钢结构焊接质量检验记录表 4页

2023年09月甘肃省迭部县公开招考26名基层司法.. 92页

火电工程施工组织设计方案 234页

《无人机操控技术》课程标准 - 6页

提高水泥搅拌桩施工质量一次合格率 17页