文档介绍:研究生优秀毕业论文
大连理工大学硕士学位论文
摘 要
近年来,各式各样的在线社交网络,如FaCebook,Twi他r,Li业edIn等,都在以惊人的速度迅猛发展,并逐渐成为人们网络生活中不可或缺的一部分。然而,各个社交网站的账号之间是孤立没有联系的,用户网络行为散落在各个网站中使得对网民的社交行为分析变得十分困难。同时由于缺乏一个全局的用户身份标识来关联各个社交账号,因此导致无法获得一个完整的社交用户网络图。
身份识别问题就是用来识别出在各个社交网络拥有多个虚拟账号背后的用户。现阶段关于身份识别问题的研究还存在一些缺陷:一方面,现阶段的识别技术大多依赖属性字符串的匹配以及对匹配结果的组合。另一方面,用户在各个社交网络中的非好友关系
没有得到充分的利用。
本文围绕解决局部身份识别问题展开了研究,、Ⅳork 中的用户匹配进行建模和算法分析。
在充分利用用户属性信息和链接信息的基础上,本文提出了一种用于识别多社交网络用户的基于排名的交叉匹配算法(I配M)。身份鉴别分为三个步骤账号选择,账号匹
配和匹配剪枝。在RCM算法中,首先,通过利用账号属性相似度(Pro丘1e Att而吮s Similar“y,PAS)和用户环境得分(User S眦oundiIlg Score,USS),然后选择当前得分排名最高用户来作为候选的匹配用户。然后提出用户匹配得分(User Matcllillg Score, UMS)的概念,UMS结合了PAS和网络结构,算法根据这个得分来决定与候选用户匹
配的用户。为了进一步提高匹配的准确率,受到稳定婚姻匹配算法的启发,算法加入了交叉匹配过程。最后通过简单的剪枝过程,剪取最先得到的匹配用户对来作为最终结果。文章中基于Facebook和Tw证ter真实数据的实验结果表明I犯M算法能产生更好的匹配结果。
关键词:社交网络;身份识别;交叉匹配
万方数据
多社交网络用户身份识别算法研究
Research on Algorithms for Identi矽ing Users across Multiple 0nline works
Ab stract
In recent years,diVersifo肌oIlline social ne帆orks(OSNs),F’acebook,‘IWitter a11d LinkedIll for ex锄ple,keep gro谢ng at a phenomenal rate a11d haVe e an essential pan of people’s oIdille life. However, each work is generally is01ated a11d
of users into numerous social ne铆orks makes the miIling
of iIlfo珊ation about individuals dif!Eicult and es t11e m旬or mndI砒1ces to gam a
complete Intemet users graph.
User Identit),Res01ution problem(U瓜)is to identi母也e real usersⅥ,ho had multiple vinual profiles across multiple ,tllere are still some problems about UIR:One
halld,most of Most of the existing Idemi够Resolution metllods are baSed 011ly on a嘣bute
matchiIlg(simply using s面lg simil撕够be觚een a缸butes biIling such s血il撕ties iIl
some ways).On nle otller hand,the relations虹ps of are not mlly utilized.
111仳s p印er,we focus on solViIlg me 10cal UIR inVestigate也e problem of
UⅡ之problem oVer —ce耐c work aIld represent t11e mamematical model and
algorimmic analysis.
BaSed on taking adVantages of pro矗le attributes aIld l血kage i