文档介绍:术题果在的资别
声明人┟:王棚厦门大学学位论文著作权使用声明必年‘月弓日本人同意厦门大学根据《中华人民共和国学位条例暂行实施办法》等规定保留和使用此学位论文,并向主管部门或其指定机构送交学位论文ㄖ街拾婧偷缱影,允许学位论文进入厦门大学图书馆及其数据库被查阅、借阅。本人同意厦门大学将学位论文加入全国博士、硕士学位论文共建单位数据库进行检索,将学位论文的标题和摘要汇编出版,采用影印、缩印或者其它方式合理复制学位论文。.经厦门大学保密委员会审查核定的保密学位论文,于日解密,解密后适用上述授权。槐C埽视蒙鲜鍪谌ā朐谝陨舷嘤ê拍诖颉啊獭被蛱钌舷嘤δ谌荨1C苎宦畚应是已经厦门大学保密委员会审定过的学位论文,未经厦门大学保密委员会审定的学位论文均为公开学位论文。此声明栏不填写的,默认为公开学位论文,均适用上述授权。本学位论文属于:年月
摘要微博数据搜索应用——“搜索兴趣畚牡闹饕9ぷ魅缦拢随着互联网的飞速发展和互联网信息爆炸式的增长,海量数据处理越来越受到人们的关注。微博,作为今后互联网最重要的发展方向的一个重要的代表模式之一,已经成为了许多人最重要的沟通、营销工具。这些活动产生的海量微博数据的处理和利用,成为一个热门的研究课题,而对这些海量的微博数据最为直接应用,就是基于微博数据的搜索引擎。本文将在着重讨论与研究相关的海量数据处理的同时,研究与设计一个新的首先,研究与讨论了相关的海量数据处理技术,主要是海量数据存储,海量数据读取,以及海量数据业务处理等技术,而支撑这些技术的主要是的三大核心技术:,植际轿募低常琈分布式编程模型。其次,本文研究与讨论了基于三大核心技术原理而实现的一个优秀的开源项目:项目,主要涉及到了相关的芄梗琀文件存储,分布式文件系统;同时,研究与讨论了搜索引擎,主要对搜索工具包、的发展历史、特性以及体系结构等进行了深入研究。最后,提出了一个与相结合的体系结构,利用的分布式结构和预先分词技术对搜索引擎的索引生成进行了高效的优化;同时,提出龌谖⒉┬巳に阉鞯呐琶惴ǎㄕ攵晕⒉┠谌荨⒂没畔⒌娜ㄖ的型和采用语义树进行语义扩展等,最终实现了基于微博内容搜索相同兴趣用户的应用。实验表明,论文设计与实现的兴趣搜索平台其搜索结果准确和可信,可以帮助用户找到不易被发现的相同兴趣用户,具有良好的实用性,对现有的微博搜索应用是一个良好的补充。关键词:海量数据处理;:
.;琲丘琁,’琲籋籗
目录第二章海量数据处理核心技术及原理⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.第一章引言⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯论文的主要工作⋯...⋯⋯⋯...⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.叫运惴ā狿算法⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯研究背景⋯⋯⋯⋯⋯...⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯问题的提出⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.论文的结构安排⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯...⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯...⋯⋯。植际酱娲ⅰ植际酱娲⒓蚪椤.<腒—植际酱娲⑾⋯⋯...⋯⋯⋯⋯......。..⋯⋯⋯.⋯⋯⋯⋯⋯⋯.篒数据模型⋯⋯.:⋯:⋯⋯⋯⋯..:⋯.:⋯⋯⋯骸海骸核心组件⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯际跫霸怼氪撤植际轿募低车那稹植际轿募低臣芄埂J荨喑棠P图际跫霸怼喑棠P突驹怼幕局葱泄獭煽啃圆呗约八惴ā....⋯⋯............⋯................⋯⋯⋯⋯............
.!.峁允尽本章小结⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯。