1 / 5
文档名称:

数据挖掘实验报告三.doc

格式:doc   大小:894KB   页数:5页
下载后只包含 1 个 DOC 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

数据挖掘实验报告三.doc

上传人:相惜 2021/10/21 文件大小:894 KB

下载得到文件列表

数据挖掘实验报告三.doc

相关文档

文档介绍

文档介绍:精选文档,供参考!
页脚下载后可删除,如有侵权请告知删除!
精选文档,供参考!
实验三
实验原理
K-Means算法是一种 cluster analysis 的算法,其主要是来计算数据聚集的算法,主要通过不断地取离种子点最近均值的算法。
在数据挖掘中,K-Means算法是一种cluster analysis的算法,其主要是来计算数据聚集的算法,主要通过不断地取离种子点最近均值的算法。
算法原理:
(1) 随机选取k个中心点;
(2) 在第j次迭代中,对于每个样本点,选取最近的中心点,归为该类;
(3) 更新中心点为每类的均值;
(4) j<-j+1 ,重复(2)(3)迭代更新,直至误差小到某个值或者到达一定的迭代步数,误差不变.
空间复杂度o(N)
时间复杂度o(I*K*N)
其中N为样本点个数,K为中心点个数,I为迭代次数
实验目的:
1、利用R实现数据标准化。
2、利用R实现K-Meams聚类过程。
3、了解K-Means聚类算法在客户价值分析实例中的应用。
实验内容
依据航空公司客户价值分析的LRFMC模型提取客户信息的LRFMC指标。对其进行标准差标准化并保存后,采用k-means算法完成客户的聚类,分析每类的客户特征,从而获得每类客户的价值。编写R程序,完成客户的k-means聚类,获得聚类中心与类标号,并统计每个类别的客户数
精选文档,供参考!
页脚下载后可删除,如有侵权请告知删除!
精选文档,供参考!
实验步骤
1、 依据航空公司客户价值分析的LRFMC模型提取客户信息的LRFMC指标。
精选文档,供参考!
页脚下载后可删除,如有侵权请告知删除!
精选文档,供参考!
2、确定要探索分析的变量
3、利用R实现数据标准化。
4、采用k-means算法完成客户的聚类,分析每类的客户特征,从而获得每类客户的价值。
精选文档,供参考!
页脚下载后可删除,如有侵权请告知删除!
精选文档,供参考!
实验结果
客户的k-means聚类,获得聚类中心与类标号,并统计每个类别的客户数
思考与分析
使用不同的预处理对数据进行变化,在使用k-means算法进行聚类,对比聚类的结果。kmenas算法首先选择K个初始质心,其中K是用户指定的参数,即所期望的簇的个数。这样做的前提是我们已经知道数据集中包含多少个簇.
与层次聚类结合
经常会产生较好的聚类结果的一个有趣策略是,首先采