1 / 4
文档名称:

频繁项集挖掘算法综述.pdf

格式:pdf   页数:4页
下载后只包含 1 个 PDF 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

频繁项集挖掘算法综述.pdf

上传人:wh7422 2015/10/14 文件大小:0 KB

下载得到文件列表

频繁项集挖掘算法综述.pdf

文档介绍

文档介绍:诬训婵��旦竖:��——频繁项集挖掘算法综述���芍С侄却笥诟�ㄖС侄鹊南罴�8�ǖ闹����算法�传统的关联规则挖掘算法是以温磊���数据挖掘也叫数据库中的知识发现,是指在数据库中发现数据挖掘也叫数据库中的知识发现,是从大型的数据库中发现潜在的、新颖的、有价值的、能被用户理解的概念和信息的过程Ⅲ。在数据挖掘研究中关联规则挖掘是一个非常重要的研究领域。关联规则挖掘起源于对超级市场“购物篮”问题的研究,主要是发现交易数据库中项与项之间的关联关系Ⅲ。关联规则挖掘研究起初主要应用于诸如市场分析、决策制定、商业管理等领域,但随着研究的不断深入,关联规则挖掘研究的应用越来越广泛,已扩展到了网络分析、天文学和生物学等领域。一个典型的关联规则挖掘的例子是���墓�客在购买面包的同时也购买了牛奶。关联规则挖掘问题由�瓵���在��,��,�海��琭。�怯蓆/个不同项目组成的项集,给定一个事务数据库�珼中的每个事务,是,中一组项目的集合,显然满足�闕。如果�阾,称事务�С窒罴痻。关联规则是如下形式的一种蕴含:���渲蠿��瑈£,,且Ⅳ���葡罴�⒕哂写笮∥!坏闹С侄龋�绻鸇中有�サ氖挛裰С窒罴痾;��乒亓9嬖騒�在事务数据库�芯哂写�小为�闹С侄龋�绻�罴�鬥�闹С侄任猤��乒嬖虿��谑挛袷�菘釪中具有大小为�的可信度,如果�兄С窒罴痻的事务中有�サ�现满足用户提出的最小支持度和最小可信度的规关联规则挖掘问题可分解为两个子问题:持度叫最小支持度������,生成的项集叫大项�����蚱捣奔�����,所以目前专家学者研究的主要问题就集中在如何以最小的计算成本和最短的计算时间来实现频繁项集的发现过程。算法;第�诮樯芰礁鲂滤惴‵�猤����算法;最后讨论了挖掘频繁项集问题的未来研究方���涞钠捣毕罴�诰蛩惴�多次扫描数据库为特征,其中代表算法就是����岢龅�����惴āT擞每矶扔畔鹊牟呗裕�在扫描数据库时利用了“任何一个大项集的子集都是大项集,任何一个弱项集的超集都是弱项集“这一定理进行剪枝。第一次扫描数据库时简单地统计各项出现的频度,计算出�钇捣奔��贙项频繁事务同时也支持项集��关联规则的挖掘就是在指定的事务数据库�蟹�集�����杂诟�ǖ拇笙罴��又猩�晒亓9嬖颉�本文组织如下:第�诮樯芑�贏��的经典��������坏�节介绍挖掘最大频繁项集的����则【�俊�】【”。������向。天津大学管理学院。天津市卫津路�号�关联挖掘问题由于其广泛的应用前景而受到专家学者的极大关注。作为关联规则挖掘的重要一步,如何有效地发现交易数据库中的频繁项集成为研究的重重点。。最后提出了关联规则挖掘未来的研究方向。关键词:关联规则挖掘;频繁项集���籱���籪����下:摘要:���������:�������������.��������:������中。��,���,������甀����.�������������.�
.——高了计算效率。���蟧�则是将����惴�塑茎翌叁丝塑苎鲨箜整而生成�钇捣奔�U庋�看紊�枋�菘庵皇羌扑�候选集�的支持度。在同一篇文章中�����项集数据库��蟃�属性的计