文档介绍:北京邮电大学
硕士学位论文
彩铃统计分析平台数据采集与预处理子系统的设计与实现
姓名:王续宗
申请学位级别:硕士
专业:计算机科学与技术
指导教师:廖建新
20080228
彩铃统计分析平台数据采集与预处理子系统的设计与实现摘要彩铃业务是“个性化多彩回铃音业务”简称,是一项由被叫用户定制,为主叫用户提供一段悦耳的音乐或一句问候语来替代普通回铃音的业务。近年来,彩铃业务以其新颖、个性化的特点,在国内得到了迅速发展,已经成为电信运营商档重要贡献力量和新的利润增长点。彩铃用户多为年轻人群,为了满足他们追求时尚和个性的需求,运营商不断推出彩铃新功能和特色服务,并不定期地举办各种营销活动。为了更好地监控业务的运行,发现用户偏好,运营商提出的统计需求越来越多,并需要及时得到统计数据并加以分析。传统上,这些需求的实现需要加载到彩铃业务主机运行。这在一定程度上消耗了彩铃系统的主机资源,影响彩铃系统的正常运行。另一方面,统计分析的结果不够丰富和灵活,及时性、针对性不强,难以满足运营商的要求。彩铃统计分析平台珻亲ㄎ彩铃业务推出的统计分析解决方案。通过把彩铃业务相关数据采集到专有的统计分析主机,然后在此主机上进行数据加工和运算,从而有效地缓解了彩铃系统的运行压力,降低了彩铃业务主机的负荷。同时,该系统充分利用了统计主机的计算能力和存储资源,更有效地进行数据加工,向用户提供专业、详实的统计数据,并通过多种方式展现给用户。彩铃统计分析平台可划分为数据采集层、数据预处理层、数据处理层和数据展现层四个功能层。本文的核心是设计并实现数据采集与预处理子系统,它实现了数据采集层和数据预处理层的功能。数据采集层负责将原始数据从彩铃业务主机批量采集到统计分析主机,加载到数据库中。数据预处理层则根据预先定义的规则,对原始数据进行清洗和格式转换,删除脏数据并保证数据格式的正确性,为上层系统提供可靠的数据保障。
本文从彩铃业务的发展现状展开讨论,第一章介绍了彩铃业务的背景,分析了运营商对彩铃统计的需求,并介绍了彩铃统计分析平台的总体结构。第二章详细分析了本文核心的数据采集与预处理子系统的需求,对子系统的实现难点和关键技术特征进行了总结,并对比不同的解决方法,找到了合理的解决方案。第三章在需求分析的基础之上,对子系统的设计与实现进行详细的介绍。首先介绍了子系统的结构和工作流程,并根据功能将子系统划分为数据采集、历史数据管理和数据预处理三大模块。然后对各个模块的详细设计与实现进行了介绍。第四章对数据采集与预处理子系统进行了测试,以验证其满足系统需求。最后一章对彩铃统计分析平台的现状进行了介绍,提出了需要改进和进一步研究的问题,并对彩铃统计分析平台的前景进行了分析和展望。关键词:彩铃,统计分析,数据采集,数据清洗,数据格式转换
.,,疭.,,.瓵甎,,畆,
篊,瑆.,.,.琣.,.瑃甌,疭,.,瑂琒瓵,猵甌甌甀癲瑃痵猵,甀琩甌,
趁竺星鳎荒日期:鲨堑:丝:桌迹荷教育机构的学位或证书而使用过的材料。与我一同工作的同志对本研究所做的任申请学位论文与资料若有不实之处,本人承担一切相关责任。保密论文注释:本学位论文属于保密在一年解密后适用本授权书。非保密论独创性虼葱滦声明本人声明所呈交的论文是本人在导师指导下进行的研究工作及取得的研究成果。尽我所知,除了文中特别加以标注和致谢中所罗列的内容以外,论文中不包含其他人已经发表或撰写过的研究成果,也不包含为获得北京邮电大学或其他何贡献均已在论文中作了明确的说明并表示了谢意。本人签名:日期:关于论文使用授权的说明学位论文作者完全了解北京邮电大学有关保留和使用学位论文的规定,即:研究生在校攻读学位期间论文工作的知识产权单位属北京邮电大学。学校有权保留并向国家有关部门或机构送交论文的复印件和磁盘,允许学位论文被查阅和借阅;学校可以公布学位论文的全部或部分内容,可以允许采用影印、缩印或其它复制手段保存、汇编学位论文。C艿难宦畚脑诮饷芎笞袷卮斯娑文注释:本学位导师签名:适用本授权书。
己运营分析,为彩铃业务进一步的推广和发展提供有力的支撑。彩铃是一种应用十分广泛的电信增值业务,为运营商带来了丰厚的利润。近年来,彩铃业务发展迅猛,用户量猛增,业务功能不断丰富,简单的统计分析已经无法满足业务发展的需要。为了更好地监控业务的运行,运营商提出的针对彩铃业务的统计分析需求越来越多。传统上,这些需求的实现需要加载到彩铃业务主机运行。这在一定程度上消耗了彩铃系统的主机资源,影响彩铃系统的正常运行。另一方面,统计分析的结果不够丰富和灵活,及时性、针对性不强,难以满足运营商的要求。通过对多个省份彩铃业务统计需求的分析发现,为了提供专业详实的统计数据,满足不断涌现的新需求,同时有效减轻彩铃业务系统的运行