文档介绍:河北北工业大学硕士学位论文
模糊聚类算法研究及其其其在电信客户细分中的应用其在电信客户细分中的应用
摘摘摘要要要
聚类分析析是在无先验知识、无指导下进行数据分析析的一种数据挖掘技术术。通过先进算
法的恰当采用,发掘潜潜藏的有价值的信息,提高数据分析析和和解释的质量。在现实世界中,
许多客观事物之间的界限往往是模糊的,对事物进行分类时就必然伴随着模糊性,由此产
生了模糊聚类分析析。将模糊聚类应用到到客户细分中,相对硬聚类能更好地体现客户特征,
从而帮助助营销人员员制制定出更有针对性的营销策略,以提高客户的价值贡献。
本本文首先在介绍聚类分析析以及模糊理论的基本本概念和和相关知识的基础上,描述了模糊
C 均值算法(FCM) 的基本本原理和和步骤。从模糊划分矩阵、度量方式、加加权权指数 m、数据类
型和和聚类有效性几个方面综述模糊 C 均值算法的研究情况,并对聚类趋势势分析析的研究进行
了重点介绍。
在综述了模糊聚类的研究情况后,针对模糊 C 均值算法存在的问题提出了改进算法。
首先,一般基于欧氏距离的 FCM 算法只能检测超球体结构构的数据子集,不能差别对待样
本本的不同属性,针对这个问题提出了基于马氏距离的 MFCM 算法,提高了聚类效果果。然
后针对 FCM 算法容易陷入局部优化化的问题,将基于马氏距离的 MFCM 算法与遗传算法结
合,并对这种混合算法的遗传算子做了相应改进,得到到 GMFCM 算法。并从聚类正确率、
收敛速率和和对初值的敏感性三个方面对改进算法的性能进行了测试。
最后,将改进的模糊聚类算法应用到到电信客户细分中。实验数据为某某电信公司的小灵
通业务务数据,对这些数据经过预处理等过程后,选定客户的呼呼叫行为和和消费行为属性作为
细分变量。对客户数据作了聚类趋势势分析析及聚类有效性分析析后,使用 matlab 编程实现了改
进算法对电信客户的细分。经过多次细分实验发现改进算法性能稳定。并进一步分析析解释
了细分结果果,为企业差异化化对待客户提供了科学依据。
关键词:::模糊聚类: ,模糊 C 均值,电信客户细分
i
THE RESEARCH OF FUZZY CLUSTERING ALGORITHM AND
ITS APPLICATION IN
CUSTOMER SEGMENTATION
ABSTRACT
Cluster analysis is data mining technology without priori knowledge and guidance. Through
the appropriate use of advanced algorithms, cluster analysis can explore the potential value of
information, improve the quality of data interpretation. In the real world, the line between
objective things is often ambiguous, and the classification of things is inevitably panied by
the ambiguity. And so there is fuzzy cluster analysis. The advantage of applying fuzzy clustering
to customer segmentation is that it can reflect the characteristics of customers better than hard
clustering, and can help marketers develop more targeted marketing strategy in order to enhance
the value of customers.
This thesis introduces the concepts of cluster analysis and basic knowledge of fuzzy theory,
and then gives the principles and steps of fuzzy c-means (FCM) algorithm. In order to entirely
summarize the research of FCM, several aspects are c