1 / 136
文档名称:

基于位置社交网络的数据挖掘.pdf

格式:pdf   页数:136页
下载后只包含 1 个 PDF 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

基于位置社交网络的数据挖掘.pdf

上传人:2286107238 2015/11/2 文件大小:0 KB

下载得到文件列表

基于位置社交网络的数据挖掘.pdf

文档介绍

文档介绍:..::::..
导师躲匪查馋南中国科学技术大学学位论文原创性声明中国科学技术大学学位论文授权使用声明本人声明所呈交的学位论文,是本人在导师指导下进行研究工作所取得的成写过的研究成果。与我一同工作的同志对本研究所做的贡献均己在论文中作了拥有学位论文的部分使用权,即:学校有权按有关规定向国家有关部门或机构国学位论文全文数据库》等有关数据库进行检索,可以采用影印、缩印或扫描等复制手段保存、汇编学位论文。本人提交的电子文档的内容和纸质论文的内果。除已特别加以标注和致谢的地方外,论文中不包含任何他人已经发表或撰明确的说明。作者签名:作为申请学位的条件之一,学位论文著作权拥有者授权中国科学技术大学送交论文的复印件和电子版,允许论文被查阅和借阅,可以将学位论文编入《中容相一致。保密的学位论文在解密后也遵守此规定。签字日期:
摘要室内还是室外都很容易通过智能移动设备获取他们自身的物理位置。当社交网络和多样化定位技术融合在一起,便促发了位置社交网络琇某鱿帧T谖恢蒙缃煌缟希捎谒闹疃嘤攀疲没У奈恢檬据得到了大量的积累。大规模的位置数据背后一定隐藏着人们各式各样的生活高效地获取更多的利益。为此,本文的工作重点着眼于从过去、现在和将来三个角度进行大规模位置数据的挖掘工作,具体包括用户的位置命名、位置预测、等等。针对这些挑战,我们提出了相应的应对办法,来解决位置命名、位置预测和位置推荐等相关问题。具体而言,本文的主要研究成果、贡献和创新点可概机器学****中的排序学****问题,从而可以自动地根据用户的当前位置提供适合时机的语义名字。在方法中,我们把位置命名和本地搜索做类比,设计了一个本地搜索的框架,基于此提出用户时空偏好模型来做位置命名。基于排序学****算法结合了三个部分的模型,分别是用户偏好模型,空间偏好模型以及时间偏好模型。在提取用户偏好模型时,为了克服用户签到数据的稀疏性,我们利用排序优化的协同过滤来学****用户兴趣以增强用户偏好。另外,为了融的相近性约束。在基于点评网上的签到数据进行算法的评测。我们发现会随着智能移动设备的普及,移动互联网得到迅猛的发展。互联网的发展使得社交网络应运而生。而定位技术的多样化使得人们无论在模式和个人偏好。因而,对于这些数据的挖掘,可以发现出这些数据背后的模式、规律和偏好,从而利用这些知识来给人们带去生活上的便利,让他们学****到更多新鲜的知识,而且同时也可以让商家通过更为精准的广告、推荐的方式位置推荐三个大类问题。然而,在这种大规模数据上进行这些挖掘工作,需要应对诸多挑战,包括了数据规模、数据稀疏性、多源数据融合和分布不均匀性括为以下几点:我们提出位置命名问题,将其中从物理位置到兴趣点位置的映射问题归结为合来自于社交网络中的社交关系,我们为排序优化的目标添加朋友间行为模式
特征,也就是基于历史特征、基于时间的特征和基于空间的特征,这些特征不于这个探索预测问题,我们提出协同探索周期回归的位置预测模型来融合位置预测和位置推荐,从而利用相似用户的行为模式来缓解数据的稀疏性给位置预测带来的影响。当人们被预测去做探索的时候,借助位置推荐算法找到他们可位置访问历史进行分治的必要性,我们从多个角度进行了全面分析。另外,在生这种不均匀性的先验分布来做贝叶斯学****在两个大规模的分别具有和方法,可以提高位置预测的性能多达%。此外,我们还分析了常规位置的可预测性,并验证了序列属性、时间规律性在位置历史中的存在性。我们提出基于地理建模内嵌的矩阵分解模型来做位置推荐,以应对来自于用出发,提出利用加权矩阵分解来做兴趣点推荐,而且给从矩阵分解中学****得到间聚集效应,而且还解释了为何对这个效应的建模可以来解决矩阵稀疏的问题。权矩阵分解会比其他形式的分解模型和基于用户的协同过滤方法好,而且把空优于所提出的基准算法,%的测试查询返回准确的语义名字。我们提出探索预测问题,来预测人们下个访问位置是否是他们以前未访问过的位置,并把它归结为一个二分类问题。在这个二分类问题中,我们提出三类仅反映了人们追求新奇的个性特质,也体现了人们当时的追求新奇的状态。基能感兴趣并且与他们活动区域相近的位置;当人们被预测去做回归的时候,借助常规的位置预测算法来找出他们下一个最有可能会出现的地方。针对这种对常规位置预测算法的学****中,针对位置访问频率的不均匀性,我们采用了能产┑降氖菁辖惺道芯亢推啦狻F啦饨峁砻魈剿髟げ庠诹礁鍪集上的误分类率只有%左右,远远地优于基准方法;。这个模型从签到数据提供隐式反馈的用户隐向量和兴趣点隐向量进行扩展,分别增加了用户活动区域向量和兴趣点影响向量。基于这个增强模型,我们不仅能从二维密度估计的角度来刻画空我们在一个大规模的位置社交网络数据上进行了评测。评测的结果发现这个加间聚集效应整合到矩阵分解之后提