1 / 74
文档名称:

基于MapReduce的社会网络分析系统研究与实现.pdf

格式:pdf   页数:74
下载后只包含 1 个 PDF 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

基于MapReduce的社会网络分析系统研究与实现.pdf

上传人:banana 2014/2/8 文件大小:0 KB

下载得到文件列表

基于MapReduce的社会网络分析系统研究与实现.pdf

文档介绍

文档介绍::姓专学号:.业:师:年密级:导名:院::一
.』//丫//疘/////疕/丞芴一一盘..砬‘臣:生:釜型芝:主:么兰保密论文注释:本学位论文属于保密在一年解密后适用本授权书。非保密论芝:主:独创性虼葱滦声明本人声明所呈交的论文是本人在导师指导下进行的研究工作及取得的研究成果。尽我所知,除了文中特别加以标注和致谢中所罗列的内容以外,论文中不包含其他人已经发表或撰写过的研究成果,也不包含为获得北京邮电大学或其他教育机构的学位或证书而使用过的材料。与我一同工作的同志对本研究所做的任何贡献均已在论文中作了明确的说明并表示了谢意。申请学位论文与资料若有不实之处,本人签名::关于论文使用授权的说明学位论文作者完全了解北京邮电大学有关保留和使用学位论文的规定,即:研究生在校攻读学位期间论文工作的知识产权单位属北京邮电大学。学校有权保留并向国家有关部门或机构送交论文的复印件和磁盘,允许学位论文被查阅和借阅;学校可以公布学位论文的全部或部分内容,可以允许采用影印、缩印或其它复制手段保存、汇编学位论文。C艿难宦畚脑诮饷芎笞袷卮斯娑文注释:本学位论文不属于保密范围,适用本授权书。导师签名:
琂:
基于纳缁嵬绶治鱿低逞芯坑胧迪摘要随着互联网进入的时代,出现了越来越多的社会化网站。这些社会化的网站互相模仿借鉴,使得网站提供的服务相似程度很高,网站的同质化加剧。因此需要分析网站的用户的特点,根据用户的特点,有针对性的向用户推出服务,使得用户可以获得更好的服务体验。而传统的基于数据仓库的社会网络分析工具,在用户数据管理和数据分析上存在着很大的困难,面僮拍岩怨芾硪旃故莺头治鍪据规模过小的问题。基于纳缁嵬绶治龇椒ㄊ呛芎玫慕决方案。本文提出了一套基于纳缁嵬绶治鱿低车难芯与实现方案。本文提出了基于纳缁嵬绶治鱿低成杓品桨福进行社会网络分析所需的数据获取,数据格式转换,图处理和社会网络分析算法的设计,实现了进行社会网络分析的完整过程。数据获取使用网络爬虫从社会化的网站上进行数据抓取,分析网站奶点,通过对网络爬虫的配置文件进行设置,实现内容的精确抓取。基于纳缁嵬绶治鱿低成杓品桨钢校杓屏送即系统。进行社会网络分析,将社会网络抽象成一幅图后,需要对图中的节点和边等图数据进行处理,设计了图处理系统用于图数据的处理,向社会网络分析算法提供图数据处理能力,系统设计了图处理系统。图处理系统提供了从网络爬虫抓取的数据的数据格式向图数据格在基于纳缁嵬绶治鱿低持校枰J迪稚缁嵬绶析算法,用于对社会网络进行度量分析。本文介绍了基于进行社会网络算法设计的思想,进行算法设计时的数据结构定义等,并以点度中间度为例,介绍了基于纳缁嵬绶治鏊惴ǖ详细设计和实现过程。本文中提出的基于纳缁嵬绶治鱿低尘匝檠橹ぃ运行良好,适于对社会化网站中的大规模数据进行社会网络分析。关键字:簧缁嵬绶治觯煌缗莱妫坏愣戎屑式的转换。北京邮电大学硕士学位论文
瓢..●“
.玝气猠産,甌.,甌,.,,,瑀..
産猙篗;●.,甀.,;北京邮电大学硕士学位论文
论文的主要鳌论文的结构和安排⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.⒋ǖ莼啤目录第一章绪论⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯..研究背景⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯第二章基于纳缁嵬绶治鲅芯肯肿础喙丶际酢葱辛鞒獭际跤τ孟钅俊社会网络分析⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.缁嵬绲奶岢鲇敕⒄⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯..第三章基于纳缁嵬绶治鱿低成杓啤系统工作流程⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.系统框架设计⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯。数据抓取的设计与实现⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.菰囱≡≡∠低场数据抽取⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯..第四章基于耐即硐低成杓啤图处理系统的设计⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.蓟郍的设计⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯..┑⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯水木数据的格式转换⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.其他格式的转换⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯..⋯⋯⋯⋯⋯..点度中间度定义⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯..计算点度中间度的意义⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯...
.