文档介绍:基于六度空间原理的移动社交网络
模型说明书
中国移动广东公司
2010年12月
目录
1. 模型概述 3
. 项目背景 3
. 立足点与创新点 3
2. 基础模型构建 4
. 0度空间:单个用户-社交特征分析 4
. 1度空间:每对用户-关系特征分析 4
. 应用预研 4
. 构建边权模型 5
. 2度空间:群体用户-社区特征分析 6
. 应用预研 6
. 群体划分算法 8
. ≥3度空间:全网用户-传播特征分析 11
. 应用预研 11
. 量化传播能力 11
. 识别核心人物 11
3. 应用模型案例-潜在家庭群体挖掘 12
. 业务目标 12
. 建模思路 12
. 构建网络 12
. 建模原理 12
. 建模维度 13
. 建模步骤 13
. 数据准备 14
. 检查数据质量 15
. 数据探索 16
. 家庭计划群组样本选取 16
. 潮州家庭计划数据质量检查 16
. 家庭成员的电信行为特征分析 17
. 边权设计与群体划分 19
. 评估模型输出结果 20
. 模型部署 21
. 模型应用效果评估 21
4. 附录: 22
模型概述
项目背景
总结集团公司2010年NGBASS规范的重点应用,无论是家庭市场、学生市场、流动人口市场,或者是核心客户保有等重点应用,都需要建立在对客户交往圈的深入分析的基础之上。从理论或者技术层面来剖析,移动的交往圈实质上是一个建立在无线通信介质的人际社交网络,而社交网络又是学术界最近几年蓬勃发展的新兴领域,其科研成果是非常值得移动公司进行借鉴和应用的。基于上述的业务背景,广东移动构建“基于六度空间原理的移动社交网络模型”。
电信社会关系网络(电信社交网络)是指依据移动客户之间的电信通信行为关系构建的网络,而“六度空间原理”(Six Degrees of Separation),指任意两个人之间通过社交网络,最多经过六个人的距离就可以互通信息。广东移动用户作为庞大社会关系网络的主要部分,拥有广东完整电信社会关系网络的几乎所有性质,而且移动用户之间的通信关系的可靠性及通信数据的完整性,使得移动社会关系网络更加适合于进行挖掘,并将结果应用于移动通信公司的市场营销活动。该项目已经完成了项目框架的搭建,当前的主要工作是进行理论技术的研究及实际应用的探索。
立足点与创新点
现实生活中,存在着我们日常生活中非常熟悉的社交网络实体,经典的BBS、论坛、校友录、博客,最近比较流行的还有开心网、新浪微博等,都能够体现六度空间原理。当前,已经有很多成熟的社交网络技术在这些实体运营商日常的市场营销和商业决策中发挥了作用,而且,社交网、微博平台等都和移动互联网有着密切的合作关系,因此移动社交网络化将是一个趋势。基于上述的观点,广东移动立足于社交网络多方面潜在的、长远的应用价值,构建了基于六度空间原来的移动社交网络基础模型,并在此之上,建立了潜在家庭群体挖掘、真实集团关系识别、竞争对手反挖等应用子模型。本案已通过集团审批,并由中国国家知识产权局受理,申请号为《ZC0912001通信用户组的识别方法及系统》,其创新点体现在以下几个方面:
分析方法创新
社交网络是从人与人之间的相互作用进行研究,如评价客户影响力、重要度(集团关键人、联系人等),挖掘紧密联系的群体(如企业、家庭等)。不同于传统模型基于单个用户的电信特征的分析。
应用方向创新
当前大部分营销活动的都是针对单个用户的实际情况,而社会网络则注重人与人之间的传播作用
,用以实施口碑营销、病毒营销等方案。
基础模型构建
对六度空间的单个用户、每对用户、群体用户、全网用户等四个对象要素进行度数的划分,每个度数可以延伸出对应的社交网络理论和技术,但在这些理论技术基本上都不能直接套用,因此该项目在结合具体业务应用的基础上,对技术进行改进和创造,并在研究和实践中构建出了每一度上的基础模型。
0度空间:单个用户-社交特征分析
对于0度空间,对应的网络就是单个用户,对应于网络的单个节点(如下图)。
深圳社交网络(基于深圳201005月交往圈数据)
0度的重要工作是建立每个用户电信行为的特征标签库,但其只侧重于电信社交特征,目的在于为以下的所有分析做好基础性的网络建设工作。
主叫
被叫
短信飞信
通话
内向型:不容易被影响阅读型:具有手机阅读习惯
客户电信社交特征刻画例图
1度空间:每对用户