文档介绍:电信套餐个性化推荐模型
摘要:在内忧外患的市场环境下,电信运营商推出大量的电信套餐用以满足用户的各类电信服务需求,但是过量套餐加大了用户选择合适套餐的难度,对用户造成了困扰。针对电信套餐的个性化推荐问题,通过数据挖掘技术构建了基于用户消费行为的电信套餐个性化推荐模型。
关键词:电信套餐;数据挖掘;协同推荐
引言:近几年,随着国内电信市场逐渐饱和,运营商基础通信服务慢慢呈现供大于求的局面,新用户净增数逐年呈下降趋势,三大运营商之间的竞争也日趋白热化,运营商在价格竞争的同时,设计推出大量的电信套餐来满足日新月异的用户需求。然而大量电信套餐的上市行为并没有缓解各大运营商的竞争压力,反而引发一系列的问题[1]:(1)对于用户来说,电信套餐数量庞大,多种套餐的捆绑内容和额度近似,月租费却又相差很多,很难从大量的套餐中快速选择出符合用户需求的套餐,同时用户和套餐的不适配会对用户造成不必要的经济损失,容易引发用户对电信企业形象的负面评价,最终造成用户流失。(2)从企业角度来看,电信企业难以把握用户的需求和市场热点,对于新套餐的推广仍然采用粗放式的广告投放方式,造成用户审美疲劳,高成本,低回报,实际推广效果不理想,造成企业大量资源浪费。因此,电信系统主动向用户推荐合适套餐的研究十分必要。本文对协同过滤算法及其关键技术做了详细分析,并针对电信行业特点设计了电信套餐的个性化推荐模型,并对模型的主要模块进行了详细介绍。
一、协同推荐算法及其关键技术
(一)协同过滤推荐的概念。协同过滤推荐[2]也被称为社会过滤推荐,在社会群体中以兴趣相似度为度量寻找用户间的相关性,或发现项目间的相关性,基于这些关联性进行推荐活动。实现协同推荐主要有三个步骤:步骤1:收集用户偏好数据。步骤2:计算相似度,找到相似用户群或者物品。步骤3:依据推荐策略,进行推荐计算。协同过滤推荐算法根据相似度比较对象的不同,可分为基于用户的协同推荐和基于物品的协同推荐。
(1)基于用户的协同推荐算法。根据历史数据,计算所有用户对产品的喜好程度,并由此找到目标推荐用户的相似邻居集,依据算法原则“邻居用户喜欢的产品,目标推荐用户也可能喜欢”将邻居用户喜欢的产品汇总并排序形成推荐集推荐给目标用户。(2)基于物品的协同推荐算法。根据历史数据,计算所有用户对产品的喜好程度,并由此找到相似物品集,依据算法原则“正在使用物品的相似物品,用户也可能喜欢”将相似物品汇总并排序形成推荐集推荐给目标用户。
(二)相似度计算。在推荐的场景中,需要进行用户间的相似度计算,或者进行物品间的相似度计算,以下为几种常用的相似度计算方法:
(1)欧几里德距离。欧氏距离是最容易理解的一种距离计算方法,源自欧氏空间中两点间的距离公式。两个n维向量a
(x11,x12,…,x1n)与b(x21,x22,…,x2n)间的欧氏距离。
d(x,y)=■公式(1)
(2)Cosine相似度。Cosine 相似度被广泛应用于计算文档数据的相似度。T(x,y)=■=■公式(2)
(3)皮尔逊相关系数。皮尔逊相关系数一般用于计算两个定距变量间联系的紧密程度,它的取值在[-1,+1] 之间。
p(x,y)= ■=■公式(3)
注:Sx, Sy是 x 和 y 的样品标准偏差。
(三)相似邻居的计算。