1 / 79
文档名称:

基于hive分布式计算与数据挖掘的关联性营销的设计与实现.pdf

格式:pdf   页数:79
下载后只包含 1 个 PDF 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

基于hive分布式计算与数据挖掘的关联性营销的设计与实现.pdf

上传人:Horange 2014/2/28 文件大小:0 KB

下载得到文件列表

基于hive分布式计算与数据挖掘的关联性营销的设计与实现.pdf

文档介绍

文档介绍:岁妻未交舨专业硕士学位论文基于分布式计算与数据挖掘的关联性营销的设计与实现作者:贾文娟导师:李宇北京交通大学月.●●●●‘丑●
翩签名:衡学位论文作者签名:唁签字日期:加年莎月易日阨月加日学位论文版权使用授权书本学位论文作者完全了解北京交通大学有关保留、使用学位论文的规定。特授权北京交通大学可以将学位论文的全部或部分内容编入有关数据库进行检索,提供阅览服务,并采用影印、缩印或扫描等复制手段保存、汇编以供查阅和借阅。同意学校向国家有关部门或机构送交论文的复印件和磁盘。C艿难宦畚脑诮饷芎笫视帽臼谌ㄋ得签字日期:
专业硕士学位论文基于分布式计算与数据挖掘的关联性营销的设计与实现作者姓名:贾文娟导师姓名:李宇工程领域:软件工程职称:副教授学位级别:硕士北京交通大学月学号:
致谢治学态度和科学的工作方法给了我极大的帮助和影响。在此衷心感谢两年来李宇了我很大的关心和帮助,在此向李宇老师表示衷心的谢意。李宇教授对于我的科研工作和论文都提出了许多的宝贵意见,在此表示衷心给予了热情帮助,在此向他们表达我的感激之情。本论文的工作是在我的导师李宇教授的悉心指导下完成的,李字教授严谨的老师对我的关心和指导。李宇教授悉心指导我们完成了实验室的科研工作,在学习上和生活上都给予的感谢。在实验室工作及撰写论文期间,徐龙生等同学对我论文中的分布式研究工作另外也感谢我的家人,他们的理解和支持使我能够在学校专心完成我的学业。
中文摘要在网购人群数量急剧增长的今天,互联网公司每天都会收集到上侗鸬罩竞褪荩庑┦菡媸档丶锹剂嗣恳桓鲇没У姆梦市形#凶欧浅8叩挖掘和研究价值。通过深入地挖掘和研究这些数据,可以获得大量有价值的潜在信息,分析出用户的行为规律,为产品运营人员提供客观可靠的依据,使他们的营销更具针对性,从而大大提高营销的效果。传统的关系数据库在面对上侗鸬暮A渴荽硎币丫缘昧Σ淮有模分布式计算平台琱的出现恰好解决了海量数据处理的计算瓶颈,让基于海量数据的数据挖掘成为可能。在淘宝买家数量庞大且稳定增长的情况下,卖家的经营开始从粗放型向精细型转化,而关联性营销就是其手段之一,本文以淘宝所有买家的海量行为日志和数据为基础,使用经典关联规则算法惴ǎ褂梅植际郊扑闫教ń萁行分布式某槿⑶逑础⒆;⒓釉睾螅玫讲繁还郝虻墓亓6龋钪战结果简单明了地提供给卖家,为他们进行关联性营销提供真实可靠的数据依据,从而大幅度提高营销的效果,最终提高用户黏性和客单价。关键词:分布式计算,,,关联性营销,海量数据
。,,:,.瑃琈狶,.瑆、,琣.,.琀琀珻...甀琧痵
序有的海量交易的历史数据进行深入和系统的挖掘,通过对买家历史浏览和购买行当今淘宝已经拥有大量稳定买家和卖家,如何帮助卖家提高点击转化率、客单价等指标,如何帮助他们更好地留住进入店铺的买家,让购买一样商品成功的买家去点击和购买更多本店商品,已经成为我们迫切想要解决的问题。受沃尔玛超市“啤酒和尿布’’的经典案例的启发,我们提出了为满足买家实现一站式购物的捆绑式销售。本项目是基于现有的已经比较成熟的关联规则算法如惴ǎ蕴员ο为进行分析,寻找买家浏览或购买商品或者商品类别之间的联系和规律,然后将这些关联数据在历史已有的部分捆绑销售数据的基础上进行了验证,为我们所研究的捆绑式销售抽象出了可靠稳定的模型。因为有海量的真实数据支持,在此过程中,我们还根据实际情况通过不断循环验证与比对,调整和优化了最终的数据模型。最后在捆绑式销售模型成型之后,我们还将其应用于近百家店铺,追踪验证了其效果。
目录中文摘要⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯一序⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯项目简介⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.序言⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯项目的背景、目的和意义⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯。使用技术⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯项目需求分析⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯莩槿×⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.开发环境配置⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.配置⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯配置⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.迪至鞒獭基础数据准备及新类目定位⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.∈萃诰颉⋯⋯⋯⋯⋯⋯