1 / 43
文档名称:

关联规则简介与Apriori算法.doc

格式:doc   大小:347KB   页数:43页
下载后只包含 1 个 DOC 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

关联规则简介与Apriori算法.doc

上传人:小s 2021/10/31 文件大小:347 KB

下载得到文件列表

关联规则简介与Apriori算法.doc

文档介绍

文档介绍:关联规则简介
关联规则
►关联规则(Association Rules)反映一个事物与 其他事物之间的相互依存性和关联性。如果两个或 者多个事物之间存在一定的关联关系,那么,其中 一个事物就能够通过其他事物预测到。首先被 Agrawal, Imielinski and Swami在 1993年的 SIGMOD会议上提出.
►关联规则挖掘是数据挖掘中最活跃的研究方法之一 。典型的关联规则发现问题是对超市中的购物篮数 据(Market Basket)进行分析。通过发现顾客放 入购物篮中的不同商品之间的关系来分析顾客的购 —头习惯。
案例
“尿布与啤酒”的故事。
►美国的沃尔玛超市对一年多的原始交易数据进行了详细的 分析,得到一个意外发现:与尿布一起被购买最多的商品
竟然是啤酒。借助于数据仓库和关联规则,商家发现了这
个隐藏在背后的事实:美国的妇女们经常会嘱咐她们的丈 夫下班以后要为孩子买尿布,而30%〜40%的丈夫在买完
尿布之后又要顺便购买自己爱喝的啤酒。有了这个发现后 ,超市调整了货架的设置,把尿布和啤酒摆放在一起销售
案例
,从而大大增加了销售额。
案例
► 70%购买了牛奶的顾客将倾向于同时购买面包。 ►某网上书店向用户推荐相关书籍。
案例
案例
购买本商品的顾客还买过
数字化生存
-盘数宇化生存》导读
-互联网:碎片化生存
・众声喧哗一一网络时代的
•公众舆论
■注薄:互联网如何毒化了
■长尾理论z・o (超级财经
•世界是平的一一21世纪简
-失控:全人类的最终命运
商业的常识(李开 复、牛文文
¥
更多》
Nim■・!(
数字化生存
案例
案例
在买了一台PC之后下一步会购买?
辰吕(Acer ) VX275台式电脑(E67
案例
案例
浏费了该曲品的用户还浏贤了
案例
K10U立怎臣至列
漫步古Udif: &r)咅福
B101V入i強系列
^VOLEl-PAD)黒色比 标垫专洪)
环宇飞扬
Hying) V6无}瓯:呱您头
硕关科(SWUC)耳机M-
2102
飞利浦
(FI订gs) SPA1312罢色
案例
►在保险业务方面,如果出现了不常见的索赔要求组 合,则可能为欺诈,需要作进一步的调查;
►在医疗方面,可找出可能的治疗组合;
►在银行方面,对顾客进行分析,可以推荐感兴趣的 服务等等。
关联规则基本模型
►什么是规则?
►规则形如”如果…那么…(lf...‘,前者为条件,后者 为结果。例如一个顾客,如果买了可乐,那么他也会购买 果汁。
►如何来度量一个规则是否够好?有两个量,置信度
(Confidence)^支持度(Support) □假设有如下表的购买
记录。
关联规则基本模型一置信度
顾客
项目
1
橙汁,可乐
2
牛奶,橙汁,空气清洁器
3
橙汁,洗洁精
4
橙汁,洗洁精,可乐
5
空气清洁器
置信度表示了这条规则有多大程度上值得可信。设条件
的项的集合为代结果的集合为B。置信度计算在A中,同
时也含有B的概率醱:if A,then B的概率}。即
Co n fide nee (A ^B)=P(B/A)。例如计算如果 Orange 则