1 / 70
文档名称:

多社交网络用户身份识别算法研究.pdf

格式:pdf   大小:6,849KB   页数:70
下载后只包含 1 个 PDF 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

多社交网络用户身份识别算法研究.pdf

上传人:wz_198620 2016/8/10 文件大小:6.69 MB

下载得到文件列表

多社交网络用户身份识别算法研究.pdf

文档介绍

文档介绍:硕士学位论文多社交网络用户身份识别算法研究 Reseallch onA培orithms forIdenti母ing Users across Multiple online works 作者姓名: 学科、专业: 学号: 孟波软件工程 21217024 完成日期: 至Q!墨生圣旦呈生旦大连理工大学 DalianUn砜rS缸y ofTech∞】ogy 万方数据大连理工大学学位论文独创性声明作者郑重声明:所呈交的学位论文,是本人在导师的指导下进行研究工作所取得的成果。尽我所知,除文中已经注明引用内容和致谢的地方外, 本论文不包含其他个人或集体已经发表的研究成果,也不包含其他已申请学位或其他用途使用过的成果。与我一同工作的同志对本研究所做的贡献均已在论文中做了明确的说明并表示了谢意。若有不实之处,本人愿意承担相关法律责任。学位论文题目: 垒塾塞圈丝周生堑坌迟墨I篡洼丑窒作者签名: 盐熏.。日期:兰呈!兰年上月上生日万方数据大连理工大学硕士学位论文摘要近年来,各式各样的在线社交网络,如FaCebook,Twi他r,Li业edIn等,都在以惊人的速度迅猛发展,并逐渐成为人们网络生活中不可或缺的一部分。然而,各个社交网站的账号之间是孤立没有联系的,用户网络行为散落在各个网站中使得对网民的社交行为分析变得十分困难。同时由于缺乏一个全局的用户身份标识来关联各个社交账号,因此导致无法获得一个完整的社交用户网络图。身份识别问题就是用来识别出在各个社交网络拥有多个虚拟账号背后的用户。现阶段关于身份识别问题的研究还存在一些缺陷:一方面,现阶段的识别技术大多依赖属性字符串的匹配以及对匹配结果的组合。另一方面,用户在各个社交网络中的非好友关系没有得到充分的利用。本文围绕解决局部身份识别问题展开了研究,、Ⅳork 中的用户匹配进行建模和算法分析。在充分利用用户属性信息和链接信息的基础上,本文提出了一种用于识别多社交网络用户的基于排名的交叉匹配算法(I配M)。身份鉴别分为三个步骤账号选择,账号匹配和匹配剪枝。在RCM算法中,首先,通过利用账号属性相似度(Pro丘1e Att而吮s Similar“y,PAS)和用户环境得分(User S眦oundiIlg Score,USS),然后选择当前得分排名最高用户来作为候选的匹配用户。然后提出用户匹配得分(User Matcllillg Score, UMS)的概念,UMS结合了PAS和网络结构,算法根据这个得分来决定与候选用户匹配的用户。为了进一步提高匹配的准确率,受到稳定婚姻匹配算法的启发,算法加入了交叉匹配过程。最后通过简单的剪枝过程,剪取最先得到的匹配用户对来作为最终结果。文章中基于Facebook和Tw证ter真实数据的实验结果表明I犯M算法能产生更好的匹配结果。关键词:社交网络;身份识别;交叉匹配万方数据多社交网络用户身份识别算法研究 Research on Algorithms forIdenti矽ing Users across Multiple 0nline works Ab stract In recent years,diVersifo肌oIlline socialne帆orks(OSNs),F’acebook,‘IWitter a11d LinkedIll forex锄ple,keep gro谢ng at aphenomenal ratea11dhaVe e an essential pan of people’s oIdille , each work is generally is01ated a11d of users intonumerous socialne铆orks makes themiIling ofiIlfo珊ation about individuals dif!Eicultand es t11em旬or mndI砒1ces to gam plete Intemet users graph. User Identit),Res01utionproblem(U瓜)is toidenti母也e realusersⅥ,ho had multiple vinual profiles across multiple ,tllere are stillsome problems about UIR:One halld,most ofMost oftheexisting Idemi够Resolution metllods are baSed 011ly ona嘣bute matchiIlg(simply usings面lg simil撕够be觚een a缸butes biIling suchs