1 / 58
文档名称:

数据挖掘从大数据库中挖掘关联规则.ppt

格式:ppt   大小:1,406KB   页数:58页
下载后只包含 1 个 PPT 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

数据挖掘从大数据库中挖掘关联规则.ppt

上传人:lu2yuwb 2019/11/3 文件大小:1.37 MB

下载得到文件列表

数据挖掘从大数据库中挖掘关联规则.ppt

文档介绍

文档介绍:数据挖掘从大数据库中挖掘关联规则第6章:从大数据库中挖掘关联规则关联规则挖掘从交易数据库中挖掘一维的布尔形关联规则从交易数据库中挖掘多层次关联规则在交易数据库和数据仓库中挖掘多维关联规则从关联挖掘到相关性分析基于约束的关联挖掘小结2001-11-62数据挖掘:概念和技术规则度量:支持度与可信度查找所有的规则X&YZ具有最小支持度和可信度支持度,s,一次交易中包含{X、Y、Z}的可能性可信度,c,包含{X、Y}的交易中也包含Z的条件概率设最小支持度为50%,最小可信度为50%,则可得到AC(50%,%)CA(50%,100%)买尿布的客户二者都买的客户买啤酒的客户2001-11-65数据挖掘:概念和技术关联规则挖掘:(基于处理数据的类型)buys(x,“SQLServer”)^buys(x,“DMBook”)®buys(x,“DBMiner”)[%,60%]age(x,“30..39”)^e(x,“42..48K”)®buys(x,“PC”)[1%,75%](例子同上)?各种扩展相关性、因果分析关联并不一定意味着相关或因果最大模式和闭合相集添加约束如,哪些“小东西”的销售促发了“大家伙”的买卖?2001-11-66数据挖掘:概念和技术第6章:从大数据库中挖掘关联规则关联规则挖掘从交易数据库中挖掘一维的布尔形关联规则从交易数据库中挖掘多层次关联规则在交易数据库和数据仓库中挖掘多维关联规则从关联挖掘到相关性分析基于约束的关联挖掘小结2001-11-67数据挖掘:概念和技术关联规则挖掘—一个例子对于AC:support=support({A、C})=50%confidence=support({A、C})/support({A})=%Apriori的基本思想:频繁项集的任何子集也一定是频繁的最小值尺度50%最小可信度50%2001-11-68数据挖掘:概念和技术关键步骤:挖掘频繁集频繁集:是指满足最小支持度的项目集合频繁集的子集也一定是频繁的如,如果{AB}是频繁集,则{A}{B}也一定是频繁集从1到k(k-频繁集)递归查找频繁集用得到的频繁集生成关联规则2001-11-69数据挖掘:概念和技术Apriori算法连接:用Lk-1自连接得到Ck修剪:一个k-项集,如果他的一个k-1项集(他的子集)不是频繁的,那他本身也不可能是频繁的。伪代码:Ck:CandidateitemsetofsizekLk:frequentitemsetofsizekL1={frequentitems};for(k=1;Lk!=;k++)dobeginCk+1=candidatesgeneratedfromLk;foreachtransactiontindatabasedoincrementthecountofallcandidatesinCk+1thatarecontainedintLk+1=candidatesinCk+1withmin_supportendreturnkLk;2001-11-610数据挖掘:概念和技术