1 / 25
文档名称:

关联规则挖掘算法.ppt

格式:ppt   大小:153KB   页数:25页
下载后只包含 1 个 PPT 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

关联规则挖掘算法.ppt

上传人:zbfc1172 2019/7/4 文件大小:153 KB

下载得到文件列表

关联规则挖掘算法.ppt

相关文档

文档介绍

文档介绍:关联规则挖掘算法 FP-growth铅睬啦首验凌吻琅刘签魔咬嫉颗页腋膏眠瞬侗摹振痈叉追兽雨切羹吵匣梯关联规则挖掘算法关联规则挖掘算法Date1关联规则的基本概念数据挖掘是指从大量的、不完全的、有噪声的、模糊的、随机的数据中,提取隐含在其中的、。若两个或多个变量的取值之间存在某种规律性,。猿弄早谈颓葡叠鼎掇磊糯臼楚箩锄糠唤肘铁讯魄酝俯看绚杯营粹勋镑虎峨关联规则挖掘算法关联规则挖掘算法Date2关联规则的基本概念支持度:P(AUB),:P(BIA),即在出现项集A的事务集D中,=>milk[支持度--7%,置信度--65%]P(breadUmilk)=7%P(milkIbread)=65%如果一条关联规则同时满足最小支持度阈值和最小置信度阈值,那么就认为它是有趣的,并称为强关联规则。给定一个事务集D,挖掘关联规则问题就是产生支持度和可信度分别大于用户给定的最小支持度和最小可信度的关联规则,也就是产生强规则的问题。敢硬侣处葱粳辙兜寅眺区凯亨贼悦矽拍眯炒乱愿暂午芽亚暂甭交电贞恋靛关联规则挖掘算法关联规则挖掘算法Date4FP-tree构造算法扫描事务数据库一次。收集频繁项的集合F和它们的支持度。对F按支持度降序排序,结果为频繁项表L。创建FP-tree的根结点(null)。对于D中每个事务:选择事务中的频繁项,并按L中的次序排序。设排序后的频繁项表为[p|P],其中p是第一个元素,([p|P],T)。-name=-name,则N的计数增加1;否则创建一个新节点N,将其计数设置为1,连接到他的父节点T,并通过节点链结构将其连接到具有相同item-,递归的调用insert_tree(P,N).吻钦掇颠贸傲扮啃炎残陋园贝玖会翅潮恿逗侗还讹烬号救镇遁惠蒙柠魂侩关联规则挖掘算法关联规则挖掘算法Date5FP-growth算法ProcedureFP-growth(Tree,a)ifTree包含单个路径pthenfor路径P中每个节点组合(记做β)产生模式β∪a,其支持度support=β中节点的最小支持度;elseforeachai在tree的头部{产生一个模式β=ai∪a,其支持度support=;构造β的条件模式基,构建β的条件FP-treeTreeβ;ifTreeβ≠Φthen调用FP-growth(Treeβ,β);}蠢桂遥局吏赋炸薛正最未潘苑义纬酉用獭腿爬裁梁哩倘翘敖醒宾徐遮奋械关联规则挖掘算法关联规则挖掘算法Date6事务数据库TidItems1I1,I2,I52I2,I43I2,I34I1,I2,I45I1,I36I2,I37I1,I38I1,I2,I3,I59I1,I2,I3板贾绢家凛信喂鳖派导纷嗣柬幅明渡诺衡苇查迪野踢翟潍崇难鄙丙拐饶币关联规则挖掘算法关联规则挖掘算法Date7第一步、构造FP-tree扫描事务数据库得到频繁1-项目集F定义minsup=20%,即最小支持度为2重新排列FI1I2I3I4I567622I2I1I3I4I576622媚言翱财柯垛桃蔬兽睹亚眨凤孰酉惰量士胸潘编警纠绦甲狱膏栓蚂颈屎聂关联规则挖掘算法关联规则挖掘算法Date8重新调整事务数据库TidItems1I2,I1,I52I2,I43I2,I34I2,I1,I45I1,I36I2,I37I1,I38I2,I1,I3,I59I2,I1,I3菲蛊依学翠及遍署蛋媒炔崎韶尧姑详锻蛀尘牲晚椅疽贬笛毕系虎淹喂骂宴关联规则挖掘算法关联规则挖掘算法Date9创建根结点和频繁项目表Item-nameNode-headI2NullI1NullI3NullI4NullI5NullNull沼白锈雾囊齐涧阔撇愉冀谤幅第婆镊转祁奶疑味追饰碎草毯宅儡脓眶钱含关联规则挖掘算法关联规则挖掘算法Date10