文档介绍:《模式识别与应用》期中设计报告
设计题目关联规则挖掘实验
班级:
姓名:
学号:
指导教师:
1实验目的
理解频繁模式挖掘的思想;
理解Apriori挖掘算法的原理;
2实验步骤
,、支持度大小等于给定值的强壮规则.
基于上述概念,我们可以很容易得到一些基本结论:
K维数据项集XK是频繁项集的必要条件是它所有K-1维子项集也为频繁项集,记为XK-1
如果K维数据项集XK的任意一个K-1维子集XK-1,不是频繁项集,则维数据项集XK本身也不是最大数据项集。
XK是K维频繁项集,如果所有K-1维频繁项集集合XK-1中包含XK的K-1维子项集的个数小于K,则XK不可能是K维最大频繁数据项集。
证明:
很明显,数据项集XK-1:的K-1维子项集的个数为K-1。如果高频繁数据项集XK-1,中包含XK的K-,则存在XK的K-1维子项集不是频繁数据项集,由结论(2)知K维数据项集本身也不是高频繁数据项集。
2・3程序流程图
程序的主体部分首先接收用户输入的最小支持度,之后读取原始数据。产生
频繁1项集的集合L,之后用Lk]产生候选c,以找出l,其中k>=2;
1KK
如图1所示是Apriori算法的程序流程图。
设置mmsupport,k=l-1
运行结果:
T
T
T
T
T
T
T
T
T
1
2
3
4
5
6
占
2,bu
2,
L
1,
b
2,
4
3
2,
3
3
3
2,
2,
TransactionList
5
3,5
3
FI1:
1|support:6
FI2:
2|support:7
FI3:
3|support:6
FI4:
4|support:2
FI5:
5|support:2
FI6:
lj2|support:4
FI7:
lj3|support:4
FI8:
lj5|support:2
FI9:
2j3|support:4
FI10:
2j4|support:2
Fill:
2j5|support:2
FI12:
1^2}3|support:2
FI13:
1^2,5|support:2
-Rules
R1:
51
R2:
4==>2
R3:
5==>2
R4:
5==>1,2
R5:
1,5=、2
R6:
2,5==>1
FrequentItemset|Suppoort
程序代码:
:
function[rules_left,rules_right]=Apriori(dataset,min_sup,min_conf)%Apriori算法计算频繁项集以及关联规则
%变量%
literals=unique(dataset);%找出所有的项,包含0
L1=zeros(0,1);%1-频繁项集supports=zeros(0,l);%频繁项集对应的支持度
L=zeros(0,size(literals,1));%频繁项集