1 / 8
文档名称:

数据挖掘实验关联规则.docx

格式:docx   大小:264KB   页数:8页
下载后只包含 1 个 DOCX 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

数据挖掘实验关联规则.docx

上传人:蓝天 2022/7/2 文件大小:264 KB

下载得到文件列表

数据挖掘实验关联规则.docx

文档介绍

文档介绍:关联规则挖掘
Association Rule Mining
实现思路
某财务公司生产了一种新产品,本题提供了 600个客户的记录,对这些客户的不同属性进行数据挖掘。 根据题目要求,首先应该对数据进行全面分析。有些属性可以忽略不计,因ome numeric
married {NO, YES} children numeric car {NO, YES} save_act {NO, YES} current_act {NO, YES} mortgage (NO, YES} pep {YES, NO}
从数据中可以看到,children只有4个取值,即0, 1, 2, 3,在bank-data, arff文件中直接将©attribute children numeric 修改为^attribute children (0, 1, 2, 3)
对于age和income的离散,
Filter一>choose^weak^fliters^unsupervised^attribute^Discretize 出现如下
双击Discretize - B 10 - M -1. 0 - R first-last,出现离散参数修改窗口,进行参数修改
因为只需要对age和income,即1, 4项进行修改,故将attribute的first-last修改为1, 4,然后将 离散的分段数改为3段,即将bins的10改为3,改完后如下所示:
然后点击0K,回到主界面后点击Apply,这样就把age和income的数据离散化。
为了显示比较清楚
^©attribute age
{' \' (-inf-34. 333333] (34. 333333-50. 666667] (50. 666667-inf) \''}
改为©attribute age (0 34, 35 50, 51_100} ^©attribute income
{' \, (-inf-24386. 173333]、'',' (24386. 173333-43758. 136667] V ',' (43758. 136667-inf) V '}
改为©attribute income {0_24386, 24386_43758, 43758_600000}
并且对整个文档上述关键字进行修改。
这样就把age, income关键字的数据都分成了三段。
childer离散后:
age昌散后:
income离散后:
6,用aprior算法进行数据挖掘
1)用置信度(confidence)作为度量,最小支持度和最大支持度分别设置为0. 1和1,置信度设置为
0. 8,并对产生的结果取PEP最为结论的关联规则整理如下:
1
married=YE children=O save_act=YES current_act=YES
==>
pep=NO
conf:()
2
married=YES children=O save_act=YES mortgage=NO
==>
pep=NO
conf:()
3
married=YES children=O current_act=YES mortgage=NO
=