1 / 10
文档名称:

基于PSO电信业数据关联规则挖掘.doc

格式:doc   大小:66KB   页数:10页
下载后只包含 1 个 DOC 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

基于PSO电信业数据关联规则挖掘.doc

上传人:sssmppp 2021/3/8 文件大小:66 KB

下载得到文件列表

基于PSO电信业数据关联规则挖掘.doc

文档介绍

文档介绍:基于PSO电信业数据关联规则挖掘
摘要:针对传统的关联挖掘算法无法结合时间属 性把握电信业数据的变化趋势而出现关联误判,效率不高的 问题,提出动态感知pso的电信业数据关联规则挖掘方法, 用时间点压缩法对连续数据进行离散化,使用包含趋势属性 的三元素模式对粒子进行编码。粒子迭代的适应值做为动态 感知变量改进粒子的更新规则。实验结果证明,这种方法能 够有效地对客户消费趋势进行预测,大大提高了关联挖掘的 效率与准确率,具有很强的实用价值。
关键词:电信业关联挖掘;变化趋势;三元素编码;PSO 中图分类号::A DOI :
10. 3969/j. issn. 1003-6970. 2013. 06. 014
0引言
电信行业的竞争愈演愈烈使运营商面对着严重的客户 流失的问题。如何将管理活动精确细分、重视营销的个性化 来挽留客户防止客户流失成为各大运营商关注的焦点[1]。 客户的日常通信行为为运营商积攒了大量的数据,这些数据 蕴藏着丰富的客户消费行为****惯,对客户的消费行为、客户 服务信息和缴费情况等数据进行分析挖掘可以对客户实施 个性的客户业务推荐来挽留客户,提升客户价值[2-3] o通
过关联规则进行客户的业务推荐是各大运营商常用的技术, 伴随着各种改进的关联挖掘算法也出现了各种优秀的数据 仓库与挖掘系统应用在电信业的客户消费行为数据挖掘中 [4-5]o
客户在消费行为中常常存在着一定的趋势属性,传统的 关联挖掘算法应用在电信业客户消费行为分析挖掘中仅仅 将客户的消费记录数据进行单独的数据预处理,通过频繁项 集的计算来进行支持度与置信度约束下的关联挖掘[6-7] o 这种方法忽略了记录间存在的变化与联系,造成了关联挖掘 的误判,挖掘的效果达不到要求。
为此提出了动态感知PSO关联的电信业客户消费行为分 析方法。将群体智能的搜索优化技术通过目标函数的设计与 关联规则挖掘进行联系。使用重要时间点压缩的方法对连续 数据进行预处理与相似形度量,这种处理可以保留数据的趋 势属性。通过包含时间变化的三元素微粒进行粒子的编码, 并且通过目标函数的反馈来动态调整粒子的更新参数。实验 证明,这种机制下的电信业客户消费行为关联挖掘准确率较 高且挖掘的效率也大大提升,有很强的实用价值。
1关联挖掘的数据预处理
电信业客户消费行为关联分析的数据源来自多个表或 者系统,在客户的通信消费记录中大部分是连续型的数据,
而关联规则处理的数据应该是离散型的数据。传统的离散方 法是采用区间化的数据处理办法,将连续型的数据区间化分 为不同的子区间,并且使用某一个数值代替该区间中的所有 数据,设代表客户消费行为的某一属性,且,将划分为
每一个区间分别使用一个值来代表。这种处理方法会丢 失数据中蕴藏的很多信息,特别是无法将客户消费行为的变 化趋势信息保留。本文使用时间压缩的方法来进行数据的离 散化。对离散化的数据使用相似形度量的方法来进行频繁模 式的获取。
设客户的某一属性的时间变化趋势如下图的曲线所示: 图1趋势属性的时间压缩图
在图1中选取重要时间点作为区间的划分边界点,如上 图横坐标的所示,设对应的属性数据值为,如果存在个子序 列的划分,上述的曲线可以表示为:
(3)
为了描述上述的属性的趋势信息,使用最小二乘法的思 想,将