1 / 50
文档名称:

基于星型模式的top k join算法研究.docx

格式:docx   大小:497KB   页数:50页
下载后只包含 1 个 DOCX 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

基于星型模式的top k join算法研究.docx

上传人:wz_198613 2018/5/15 文件大小:497 KB

下载得到文件列表

基于星型模式的top k join算法研究.docx

相关文档

文档介绍

文档介绍:摘 要
top-k join 查询返回用户最感兴趣的 k 个连接结果。近来 top-k join 已经成为一个重要的研究课题,其在 Web 数据库,信息抽取和数据挖掘中均有应用。星型模式的数据仓库在实际应用中也存在 top-k join 查询,如有时决策者只想查询星型连接结果中他最感兴趣的 k 个。然而,现有 top-k join 算法不适合星型模式。为了在星型模式上有效地支持 top-k join 查询,本文提出两种索引并基于这两种索引提出一个适用于星型模式的多路 top-k join 算法 MTJS。该算法通过采用一个比现有算法更优的上界和一个剪枝策略获得了更高的效率。此外,实验也表明该算法比现有算法效率更高。
获取精确的 top-k join 查询结果的代价是较高的,而且有时决策者希望牺牲 top-k join 查询结果的精确性来缩短查询的执行时间和资源消耗。更重要的是, 我们发现现有的近似 top-k join 算法因没有充分考虑星型模式的固有特点而不适合星型模式, 因而本文提出一个基于星型模式的近似多路 top-k join 算法 MT JS- e 。 MTJS - e 是 MTJS 的一个变种算法,其通过引入一个参数ε来返回近似的 top-k join 结果。MTJS - e 因使用了 MTJS 中的总上界和剪枝策略等优化, 其性能优于现有近似的 top-k join 算法。此外,我们通过实验证明了 MTJS - e 的效率优于现有算法。而且还发现 MTJS - e 返回的结果的实际精确程度远远优于其近似度定义的精确程度。
关键词:数据仓库;星型模式;多路 top-k join 算法
Abstract
Top-k join query returns k join results that users are most interested in. Top -k join has e one of the main research issues recently, and it’s dominant in many applications, for example, data mining, web databases and information retrieval. Top-k join query also exists in data warehouse based on the star schema in practical application. For example, sometimes just the top-k join results that the decision maker is most interested in are desirable. However, the current existing algorithms aren’t suitable for the data warehouse based on the star schema. In order to efficiently support top-k join query on star schema, we propose two kinds of indices and a multiple top-k join algorithm that is suitable for star schema based on these indices. By using a tighter upper bound than current existing algorithms and a pruning strategy, the algorithm is more efficient than the current existing algorithms. Furthermore, the experiment also shows that our algorithm is more efficient than the current existing algorithm.
MTJS is the exact top-k join algorithm. However, obtaining the exact top-k join query results leads to an expensive cost, and sometimes the decision maker is willing to sacrifice the accuracy of the top-k join query results to reduce the execution time of

最近更新

二零二五年度绿色校园建设项目总承包合同3篇 55页

二零二五年度绿色建筑咨询服务施工方协议书版.. 56页

二零二五年度精装新房置换对方房屋买卖及交付.. 55页

二零二五年度租赁经营性房屋租赁合同续签协议.. 45页

二零二五年度矿山安全生产责任与开采许可合同.. 58页

血液透析患者常见问题杨欢 32页

二零二五年度生物质发电站扩建施工合同3篇 64页

医疗服务监督执法过程中常见问题的探讨 50页

乳制品包装材料选购3篇 49页

造纸厂生产车间停机维修及清理标准 12页

中药记忆口诀 23页

正畸病人的护理 11页

船舶避碰优秀公开课PPT课件一等奖新名师优质课.. 42页

生药学专题知识培训 148页

一汽大众丽水恒昌绘画创作大赛方案 8页

教科版五年级科学上册蚯蚓的选择 PPT课件一等.. 17页

慢性肾衰竭医学知识宣 30页

《重庆市建筑内部装修工程施工图消防设计文件.. 22页

小学美术五年级上册画人像-人美版主题讲座PPT.. 18页

小学三年级科学上册比较水的多少PPT课件一等奖.. 22页

发育性髋关节发育不良专家讲座 32页

基础英语unit 2PPT课件一等奖新名师优质课获奖.. 34页

云南省普通初中学生成长记录 12页

盗号软件下载 1页

最新轴系结构改错答案 6页

标本前处理试题 3页

2021年天津高考数学试题(原卷版)A3 3页

福建中考英语686个高频词——【中招君】 31页

生物技术专业综述性论文范文 25页

新会计法解读 ppt课件 41页