文档介绍:puter&*1)朱庆恰汗合孜尔2)2)(新疆农业大学计算机与信息工程学院乌鲁木齐830052)(新疆农业大学数理学院乌鲁木齐830052)摘要关联规则挖掘是数据挖掘研究的重要内容之一。通过对关联规则挖掘算法的详细分析,提出了一种基于有向关联图的频繁项集挖掘算法,该方法仅需扫描数据库一次,避免了Apriori算法繁琐的连接和删除步骤,从而提高了搜索速度。关键词数据挖掘;关联规则;频繁项集;有向关联图中图分类号TP311AnImprovedAprioriAlgorithmZhuQing1)QiahanHezier2)1)(puterandInformationEngineering,XinjiangAgriculturalUniversity2),Urumqi830052)(CollegeofMathematicsandPhysics,XinjiangAgriculturalUniversity,Urumqi830052),,andhadavoidedthetediousconnectionstepandthedeletionstepoftheApriorialgorithm,,associationrules,frequentitemset,directedassociationgraphClassNumberTP3111引言数据挖掘是从大型数据库的大量原始数据中是高效迅速找出数据集D中全部频繁项集,这是问题的中心,是评价关联规则挖掘算法的标准;问题二可由最小置信度的定义求解比较容易。目前,所提取人们感兴趣的、隐含的、具有潜在应用价值的信息和知识。在数据挖掘中,关联规则挖掘算法一直是研究的重点和热点问题,典型的应用就是购物篮分析。该过程通过挖掘顾客放入购物篮中的不同商品之间的关联,分析顾客的购买习惯,从而应用于商品货架设计、货存安排以及其他商业用途。关联规则挖掘可以发现隐藏在数据库中的项集之间的关联关系,从大量事务记录中发现有趣的关联,帮助决策者制定计划。关联规则挖掘分为两个子问题:一是根据最小支持度找出数据集D中的所有频集;二是根据频繁项目集和最小置信找出关联规则。问题一的任务有的关联规则挖掘算法都是针对问题一提出的,它是决定关联规则挖掘算法性能的关键;由于数据库中的事务集通常是相当庞大的,因此需要高效的算法来挖掘这些关联规则。关联规则挖掘中发现频繁项目集是关键的技术和步骤,本文提出一种基于有向关联图的频繁项集挖掘算法,只须扫描一遍数据库,并可以大大减少连接操作。2Apriori算法最经典的关联规则挖掘算法是Apriori算法,