文档介绍:文献综述课程名称:科技写作与文献检索专业班级:姓 名:学 号:完成时间:批阅时间:关联规则挖掘Apriori算法综述完成题目:关联规则挖掘Apriori算法综述摘要:关联规则挖掘是数据挖掘研究领域中的一个重要任务,随着大量数据不停的收集和存储,从数据库中挖掘关联规则变得极为重要。关联规则挖掘Apriori算法是关联规则挖掘中的一种经典算法。为此,本文对国内外有关Apriori算法的研究现状、算法的原理、优化算法的思想进行了探讨,综述了Apriori算法的主要优化方法,并指出了Apriori算法在实际中的应用领域,提出了未Apriori算法的研究方向和应用发展趋势。关键词:关联规则;数据挖掘;Apriori算法;综述Abstract::associativerules;massivedata;opttioii;developmentaitrends1-引言数据挖掘也称数据库中的知识发现,是指从大型数据库或数据仓库中提取人们感兴趣的知识,这些知识是隐含的、事先未知的潜在有用信息,提取的知识--般可表示为概念、规则、规律、模式等形式叫大家知道,如今已可以用数据库管理系统来存储数据,还可用机器学习的方法来分析数据和挖掘大量数据背后的知识,而这两者的结合就促成了数据挖掘技术的产生。数据挖掘是一门交叉性的学科,涉及到机器学习、模式识别、归纳推理、统计学、数据库、数据可视化、高性能计算等多个领域。关联规则挖掘是数据挖掘中最活跃的研究方向之一,其本质是要找出隐藏在数据间的相互关系。Agrawal等于1993年设计了一个基木算法一Apriori算法⑵,首先捉出了挖掘顾客交易数据库中项集间的关联规则问题,其核心方法是基于频集理论的递推方法。以后诸多的研究人员对关联规则的挖掘问题进行了大量的研究。他们的工作包括对原有的算法进行优化,如引入随机采样、并行思想等,以提高算法挖掘规则的效率;提出各种变体模型,如泛化的关联规则、周期关联规则等,对关联规则的应用进行推广。关联规则挖掘作为数据挖掘的重要研究内容之一,主要研究事务数据库、关系数据库和其他信息存储设施中的大量数据项之间隐藏的、有趣的规律。关联规则挖掘最初仅限于挖掘事务数据库的布尔型关联规则⑶,近年来广泛