文档介绍：万方数据
社交网络中分类推荐用户的设计与实现张怡文碳倚,林京览龌,王引言云獂,—,琘甌内的新浪微博、腾讯微博等都拥有数亿用户。运用较广的娱乐性的社交网站,在初期虽然能吸引较多用户,却存在大量用户流失的问题。如何帮助用户找到“真正拓展人脉、发展商业、有共同事业追求”的社交圈,帮助其通过社交网站提供的可信任人际托管服务满足其拓展人脉网络的需求成为社交网站的重要目标和具有长久生命力的重要渠道⋯。—,⒄梗缃煌疽惭杆俜⒄梗国外的社交网络如:、,国第卷第年贵州师范大学学报匀豢蒲О文章编号:——.安徽新华学院信息工程学院,安徽合肥;泄蒲Ъ际醮笱Ъ扑慊蒲в技术学院,安徽合肥;暇┯实绱笱砑г海漳暇摘要:社交网络中存在密切的朋友圈子关系,而目前社交网络由于用户推荐方法单一,出现用户流失、朋友圈不明确等问题,通过用户标签的语义相似度的计算,对用户与其关注者之间的关系程度进行分析并按兴趣分类,根据分类进行关联关注用户的再推荐。通过实验验证了分类的有效性,提高了推荐效率。关键词:标签;相似度;关注用户;分类;推荐中图分类号:文献标识码:.,,簂;;收稿期:——基金项目:国家重点实验室开放课题;安徽省高校优秀人才基金作者简介:张怡文,女,硕士,讲师,研究方向:数据挖掘,信息处理,猰篶瓹ㄑ蹲髡撸撼碳倚耍淌冢芯糠较颍盒畔⒋怼’,琂:甌瓸....籧籸甆珹,珹,.,琀,—
万方数据
用『肌阿吨厂董摹▲矗⋯▲▲▲⋯▲▲▲⋯▲‘实验步骤实验曲曲曲在社交网站中,用户可以上传资源与他人共享,并且用户在上传资源时可以用任意的文字对资源进行标注,这些文字称为标签摹1昵的文章、图片、音频、视频等一系列文件定义的一个目前的社交网络用户推荐主要采用共同关注者推荐、相同工作单位推荐、标签精确匹配推荐等方法。其中相同标签推荐方法主要存在以下问题:切的用户进行推荐;标签精确匹配,没考虑语义相似性,会流失部分潜在推荐用户;没有加入用针对以上问题,选取新浪微博为研究平台,实验通过抽取用户标签,把不同标签做为不同兴趣类别,把潜在用户按类别进行划分并推荐给当前用户,本文设计一个基于用户标签的分类推荐方法。通过计算标签间的语义相似度,为关注用户打分,根据分数进行类别划分;根据打分类别划分进行模型训练,选取最优分类模型;再用最优分类模型进行潜在用户的分类推荐。系统中用户被分为悖层为任意登陆的用户,第阄S没У墓刈⒂没В层为关注用户的关注用户。系统目标为,为第阌没萍鲂趣倾向较高的第阌没АO低秤没Ч叵等缤第阌没П昵┘希俏猚集合,,其中⋯表示本层用户兴趣标签,硎本层用户标签类别数目;第阌没П昵┘俏R患希琓集合表,其中标签数目,硎镜趇个用户;由虾蚻集合用户标签产生卣螅珻簃×凡阶矩阵。其中A校层用户标签,1昵├啾鹗浚籘为行,即每个用户的标签,层用户的标签行数量;J堑鲇没П昵┒訡集合中各标签类别语义相似度的邻接矩阵;在中计算每一列的值,,根据分类分布判断第一层用户的兴趣倾向,找出用户最感兴趣的类别,对第阌没Ы蟹掷啵蓖萍龈层用网络通讯模型是控制端和被控端通讯的基础。在试验环境中通讯模型牵涉到硬件地址、认证号的比对、数据交互过程等。新浪微博开放平台是基于新浪微博客系统的开放的信息订阅、分享与交流平台,为使用者提供了海量的微博信息、粉丝关系、以及随时随地发生的信息裂变式传播渠道。实验数据集利用