文档介绍:厦门大学学位论文原创性声明辍果。本人在论文写作中参考其他个人或集体己经发表的研究成果,均本人呈交的学位论文是本人在导师指导下,独立完成的研究成在文中以适当方式明确标明,并符合法律规范和《厦门大学研究生学术活动规范孕》。另外,该学位论文为翁组的研究成果,获得翁组鸦蚴笛室的资助,在笛槭彝瓿伞请在以上括号内填写课题或课题组负责人或实验室名称,未有此项声明内容的,可以不作特别声明。声明人┟:
厦门大学学位论文著作权使用声一唧斗啵研,/劐名¨明槐C埽视蒙鲜鍪谌ā叽够本人同意厦门大学根据《中华人民共和国学位条例暂行实施办博士、硕士学位论文共建单位数据库进行检索,将学位论文的标题和年日解密,解密后适用上述授权。应是已经厦门大学保密委员会审定过的学位论文,未经厦门大学保密委员会审定的学位论文均为公开学位论文。此声明栏不填写的,默认硇法》等规定保留和使用此学位论文,并向主管部门或其指定机构送交学位论文ㄖ街拾婧偷缱影,允许学位论文进入厦门大学图书馆及其数据库被查阅、借阅。本人同意厦门大学将学位论文加入全国摘要汇编出版,采用影印、缩印或者其它方式合理复制学位论文。本学位论文属于:.经厦门大学保密委员会审查核定的保密学位论文,于月朐谝陨舷嘤ê拍诖颉啊獭被蛱钌舷嘤δ谌荨1C苎宦畚为公开学位论文,均适用上述授权。人日獭。
摘要获取用户属性,也可以发现用户访问网站页面的模型和访问习惯,为网站管理员户信息产生的,本文将在着重讨论与研究相关的海量数据处理的同时,研究与设进行收集,经过数据预处理,与数据仓库和关联规则挖掘算法相结合,实重合度统计,以及关联规则算法挖掘,结果在数据?橹幸员ū碚瓜郑钪得到所需要的关联规则模型。帮助网站进行优化,具有良好的实用性,对现有的关键词:海量数据处理;:统计分析随着互联网的飞速发展和罩臼荼ㄊ皆龀ぃA咳罩臼荽碓来越受到人们的关注。罩臼峭痉衿鞑模孀湃罩臼莸脑龀ぃ形成了海量日志。对这些海量日志数据进行挖掘,可以从中分析用户行为特征、优化网站页面提供依据。对这些应用已经有很多的研究,越来越多开源框架产生。如:开源框架,它可以高效地处理海量数据。罩就诰蚓褪欠治鲇没形L卣骱屯诰蛴计一个基于的海量日志数据处理平台,论文的主要工作如下:首先,研究与讨论了相关的海量日志数据处理技术,主要是海量日志数据的收集服务器,以及海量数据业务处理等技术,而支撑这些技术的主要是的三大核心技术:,植际轿募低常琈分布式编程模型。同时,还研究与讨论了基于三大核心技术原理而实现的一个优秀的开源项目:项目。其次,研究与讨论了海量日志数据处理平台的设计,主要是日志收集模块、统计分析模块、关联规则挖掘模块和数据模块的设计。同时,还研究与讨论了海量数据仓库的原理和关联规则算法的改进;最后,研究与讨论了基于的海量日志处理平台的实现,首先对日志现了日志数据的总体统计、访问量统计、用户数统计、新用户数统计和实现了海量日志处理的研究与应用。实验表明,论文设计与实现的数据处理平台的统计结果的准确和可信,并且日志处理应用是一个良好的补充。
..,琺阨.,瑃瑆,甌琯,瑃:,甇琣,.,.
第三章海量日志数据处理平台的设讯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯..目录第—章引言⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯。第二章海量数据处理的相关技术⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯。研究背景问题的提出⋯⋯⋯⋯⋯⋯。研究内容和意义⋯⋯⋯⋯论文的组织安排⋯⋯⋯⋯日志收集系统⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.核心技术本章小结⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯。.。日志收集模块。数据统计分析模块⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.简介⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯服务开发框架⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯技术与原理⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.际跫霸怼喑棠P图际跫霸怼娲ⅰ文件系统⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯..分布式计算引擎⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯数据仓库⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.......。..Ⅲ●■●●●●●●●●●●●●●●●●⋯⋯⋯⋯...⋯⋯⋯⋯....⋯..:簘
第四章海量日志数据处理平台的实现⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.第六章总结与展鸯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.第五章系统实验总绦⋯⋯。参考文献⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.攻读硕士期间的研究成果⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.致:≈孰.........................................