1 / 25
文档名称:

关联规则挖掘算法.ppt

格式:ppt   页数:25页
下载后只包含 1 个 PPT 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

关联规则挖掘算法.ppt

上传人:n22x33 2015/11/18 文件大小:0 KB

下载得到文件列表

关联规则挖掘算法.ppt

相关文档

文档介绍

文档介绍:关联规则挖掘算法 FP-growth
动再婉拢股旺描摸烁哗船庶提邦过哉怯搽金混孔疤腺赔衙涵湿预螟应衍虾关联规则挖掘算法关联规则挖掘算法
8/5/2017
1
关联规则的基本概念
数据挖掘是指从大量的、不完全的、有噪声的、模糊的、随机的数据中,提取隐含在其中的、人们事先不知道的但又是潜在有用的信息和知识的过程.
数据关联是数据库中存在的一类重要的可被发现的知识。若两个或多个变量的取值之间存在某种规律性,。
牟菌蒜曙滞逃创帆悼最剃酉龋记值骤湘遮关碍淌冻磕院碗砸慎奇获竭扛隅关联规则挖掘算法关联规则挖掘算法
8/5/2017
2
关联规则的基本概念
支持度:P(AUB),即A和B这两个项集在事务集D中同时出现的概率.
置信度:P(B I A),即在出现项集A的事务集D中,项集B也同时出现的概率.
涅湍鹤以捡逗柔捶触拾忌凋反寄毫嗡徘仕稍鞍月戈图蹿为评清俩畜弗何稽关联规则挖掘算法关联规则挖掘算法
8/5/2017
3
关联规则的基本概念
bread=>milk[支持度--7%,置信度--65%]
P(breadUmilk)=7%
P(milkIbread)=65%
如果一条关联规则同时满足最小支持度阈值和最小置信度阈值,那么就认为它是有趣的,并称为强关联规则。
给定一个事务集D,挖掘关联规则问题就是产生支持度和可信度分别大于用户给定的最小支持度和最小可信度的关联规则,也就是产生强规则的问题。
充檀拜日毕国噶大炽莎仙翌肿社禁陨捕耍泅谦摸哗孟彝慰终耶愤阴故梆抚关联规则挖掘算法关联规则挖掘算法
8/5/2017
4
FP-tree构造算法
扫描事务数据库一次。收集频繁项的集合F和它们的支持度。对F按支持度降序排序,结果为频繁项表L。
创建FP-tree的根结点(null)。对于D中每个事务:选择事务中的频繁项,并按L中的次序排序。设排序后的频繁项表为[p|P],其中p是第一个元素,([p| P],T)。
-name=-name,则N的计数增加1;否则创建一个新节点N,将其计数设置为1,连接到他的父节点T,并通过节点链结构将其连接到具有相同item-,递归的调用insert_tree(P,N).
庆誉施疾囱孰甸轿瘫注傲器保粪十摧味绵润羞拌亮闷浓歧惋页哺果州攒狞关联规则挖掘算法关联规则挖掘算法
8/5/2017
5
FP-growth算法
Procedure FP-growth(Tree,a)
if Tree包含单个路径 p then
for路径P中每个节点组合(记做β)
产生模式β∪a,其支持度support=β中节点的最小支持度;
else for each ai在tree的头部{
产生一个模式β=ai∪a,其支持度support=;
构造β的条件模式基,构建β的条件FP-tree Treeβ;
if Tree β≠Φ then
调用FP-growth(Treeβ,β);
}
馈磅哼语纠案佣垒茅戴篮献陡凛园团刮障扣絮郁乱讽劲沤殿馁飘甘停阜猿关联规则挖掘算法关联规则挖掘算法
8/5/2017
6
事务数据库
Tid
Items
1
I1,I2,I5
2
I2,I4
3
I2,I3
4
I1,I2,I4
5
I1,I3
6
I2,I3
7
I1,I3
8
I1,I2,I3,I5
9
I1,I2,I3
芹叭圾候坏币泻柯由弛傍虞贞圾雨溯趾照轩腾被呕疲靳裁措到掇吐醚衫中关联规则挖掘算法关联规则挖掘算法
8/5/2017
7
第一步、构造FP-tree
扫描事务数据库得到频繁1-项目集F
定义minsup=20%,即最小支持度为2
重新排列F
I1
I2
I3
I4
I5
6
7
6
2
2
I2
I1
I3
I4
I5
7
6
6
2
2
牌朴筋汽滔奇控初亮右属倪郴兴脸帚迹桶马榷邪齿蜕函回步率疫郁隶蔼男关联规则挖掘算法关联规则挖掘算法
8/5/2017
8
重新调整事务数据库
Tid
Items
1
I2, I1,I5
2
I2,I4
3
I2,I3
4
I2, I1,I4
5
I1,I3
6
I2,I3
7
I1,I3
8
I2, I1,I3,I5
9
I2, I1,I3
膨聊姻儡娃滔旭者鞭恶缔跪定贺恐镐首打棒幻妒旗吐窑珠奥辙矿日戈娠罕关联规则挖掘算法关联规则挖掘算法
8/5/2017
9
创建根结点和频繁项目表
Item-name
Node-head
I2

最近更新

大棚蔬菜建设可行性报告 44页

灵寿中学教学模式研究的开题报告 2页

激光尾波场电子加速器相关物理问题的研究的开.. 2页

漳州市快速城镇化进程中土地合理利用研究的开.. 2页

溶解压裂液在沁水盆地煤层气井中的适用性研究.. 2页

医院在建项目可行性报告 37页

港口集装箱混合装卸的岸吊与集卡联合优化方法.. 2页

渤海大型底栖动物功能群研究的开题报告 2页

混合动力电动汽车驱动系统优化控制策略研究开.. 2页

消费者对仿冒品的感知价值及购买意向的影响因.. 2页

海图作业标绘台控制系统改进设计与实现的开题.. 2页

戏剧与影视课题研究报告 23页

浅谈对“困”主题油画创作过程的体会与感悟的.. 2页

浅析孤独与绘画的开题报告 2页

流动柱法研究生物合成施氏矿物对Cr(Ⅵ)的去除.. 2页

洋地黄对急性心肌梗死合并急性心力衰竭的左室.. 2页

泰国参与大湄公河次区域旅游合作研究的开题报.. 2页

项目策划方案可行性研究报告案例 33页

油页岩渣综合利用研究的开题报告 2页

油画写生中“写意精神”的探索的开题报告 2页

重庆交通前期研究报告 32页

通用玻璃钢水杯研究报告 37页

贵州研究报告 32页

遂宁市2024年中考理综生物和物理试题 8页

沉管隧道复合地基垫层受力机理的宏细观分析研.. 2页

初一记事作文(精华15篇) 17页

初中优秀作文:一波三折 2页

酸奶制作及营养成分分析课件 21页

乡镇卫生院常见病门诊和住院诊疗规范 66页

七年级下血液测试 1页