1 / 14
文档名称:

数据挖掘论文.doc

格式:doc   大小:687KB   页数:14页
下载后只包含 1 个 DOC 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

数据挖掘论文.doc

上传人:文库旗舰店 2022/4/19 文件大小:687 KB

下载得到文件列表

数据挖掘论文.doc

相关文档

文档介绍

文档介绍:实验九:信用卡数据综合分析
信管0802 丁玲 20080501005
打开Clementine,在操作区将“可变文件”拖入操作区,右击,选择“编辑”,然后找到所要处理分析的数据源。在“类型”中选择“读取”,把数据源中各实验九:信用卡数据综合分析
信管0802 丁玲 20080501005
打开Clementine,在操作区将“可变文件”拖入操作区,右击,选择“编辑”,然后找到所要处理分析的数据源。在“类型”中选择“读取”,把数据源中各个字段的值读入。
然后进行各项分析。
K-means分析:
把K-Means模型拖到操作区中,右击,选择“编辑”,在“字段”中,选择“使用定制设置”,选择要进行分析的字段名。如下图所示:
选择“执行”后,在右侧区域生成了K-Means模型,把它拖入操作区并与数据源相连,并双击模型进行分析,结果如下图所示:
点击“查看器”,结果如下:
结果分析:
在对各项的字段进行分析时,把“个人月收入”、“张数”、“都市化程度”分成三个聚类,得出以下结论:“个人月收入”、“张数”、“都市化程度”,说明这三者对聚类的影响程度都很大。
Kohomen分析:
把Kohomen模型拖到操作区中,右击,选择“编辑”,在“字段”中,选择“使用定制设置”,选择要进行分析的字段名。如下图所示:
选择“执行”后,在右侧区域生成了Kohomen模型,把它拖入操作区并与数据源相连,并双击模型进行分析,结果如下图所示:
点击“查看器”,结果如下:
结果分析:
在对各项的字段进行分析时,把“强制停卡记录”、“性别”、“都市化程度”分成三个聚类,得出以下结论:“强制停卡记录”、“性别”,而“都市化程度”,说明“都市化程度”对聚类的影响程度很大,而“强制停卡记录”、“性别”的影响程度几乎为0。
两步:
把两步模型拖到操作区中,右击,选择“编辑”,在“字段”中,选择“使用定制设置”,选择要进行分析的字段名。如下图所示:
选择“执行”后,在右侧区域生成了两步模型,把它拖入操作区并与数据源相连,并双击模型进行分析,结果如下图所示:
点击“查看器”,结果如下:
结果分析:
在对各项的字段进行分析时,把“个人月收入”、“婚姻”、“瑕疵户”分成三个聚类,得出以下结论:“个人月收入”、“婚姻”,而“瑕疵户”,说明“强制停卡记录”、“性别”对聚类的影响程度很大,而“都市化程度”的影响程度几乎为0。
异常分析:
把异常模型拖到操作区中,右击,选择“编辑”,在“字段”中,选择“使用定制设置”,选择要进行分析的字段名。如下图所示:
选择“执行”后,在右侧区域生成了异常模型,把它拖入操作区并与数据源相连,并双击模型进行分析,结果如下图所示:
为了更好的查看异常的情况,创建一张表来显示异常的信息。在输出表之前先做
“排序”处理。执行后结果如下图:
结论分析:
在字段“$O-Anomaly”中,若字段值显示为“F”,则为正常用户;若字段值显示为“T”,则为异常用户。如用户“111”为异常用户。
关联分析:
在关联分析中,选定的字段如下图:
选择“执行”后,在右侧区域生成了选定字段的神经网络模型,把它拖入操作区并与数据源相连,并双击模型进行分析,结果如下图所示:
结论分析:
%,说明个人月收入与星座、瑕疵户有很大的关联程度。