1 / 26
文档名称:

虚拟社区中的社区发现算法.doc

格式:doc   页数:26
下载后只包含 1 个 DOC 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

虚拟社区中的社区发现算法.doc

上传人:1006108867 2013/7/16 文件大小:0 KB

下载得到文件列表

虚拟社区中的社区发现算法.doc

文档介绍

文档介绍:行业论文精品资料虚拟社区中的社区发现算法#苗蕊,刘鲁**(北京航空航天大学经济管理学院,北京100191)510摘要:从虚拟社区中发现隐含的子社区对于理解用户间合作和交流的模式,挖掘不同用户的兴趣,促进知识共享具有十分重要的意义。本文在LatentDirichletAllocation模型的基础上,提出了一个社区-用户-主题模型,该模型能够根据社区用户之间的交互关系和讨论的内容来发现隐性的子社区,并提取出每个子社区中的兴趣主题以及每个子社区中有代表性的用户。本文还给出了基于Gibbs抽样的社区-用户-主题模型的推断算法。在NIPS数据集上的实验表明,本文提出的社区发现算法所发现的子社区和兴趣主题都是有效的。关键词:管理信息系统;虚拟社区;社区发现;LatentDirichletAllocation;社区-用户-主题模型中图分类号:munitiesMIAORui1,LIULu2(,BeihangUniversity,Beijing100191;,BeihangUniversity,Beijing100191)2025Abstract:municationpatternsofusers,,munity-User-munitydetectionwhichincorporatesboththeco--User-:ManagementInformationSystems;munitydetection;munity-User-Topicmodel300引言目前,诸如BBS等形式的虚拟社区已经成为了一个重要的知识共享平台。在虚拟社区中,每一个社区用户都可以就自己感兴趣的主题与社区中的其他用户进行讨论,提出自己的问题,得到其他用户的回复。通过这种不断地讨论和交流,虚拟社区用户会构建个人的社会3540关系连接,从而形成一个社会关系网络。这个社会关系网络是虚拟社区的重要基础,它承载着社区用户在交互中形成的复杂关系,为社区用户间的信息交换和知识共享提供了支持。在这样的社会关系网络中又存在着许多的隐性的子社区,同一个子社区内的用户间的联系要比子社区内的用户和其他子社区的用户的联系更为紧密。这些隐性的子社区往往是一些兴趣相同或相似的用户组成的小组,每一个小组的兴趣通常表现为某个或某几个主题。因此,从社会关系网络中挖掘隐含的子社区结构对于理解社区内知识的创造、表示和共享,研究社区中不同用户的兴趣具有十分重要的意义。然而,由于网络规模巨大,隐性子社区的数量较大,每一个子社区的结构又在不断地变化,因而无法通过人工的方式去发现和维护子社区,而是基金项目:教育部博士点基金资助项目()作者简介:苗蕊(1982-),女,博士,主要研究方向:管理信息系统,知识管理行业论文精品资料通信联系人:刘鲁(1947-),女,教授,主要研究方向:-mail:******@buaa.-1-行业论文精品资料需要研究自动化或者半自动的社区发现技术。如何从复杂网络中发现隐含的子社区一直是学术界关注的问题,许多学者提出了基于图455055606570论的社区发现算法,包括光谱图分割[1,2]、层级社区发现算法[3]和基于随机行走的聚类算法[4]等。这些基于图论的社区发现算法利用了节点间关系的信息,其隐含的基本假设是:子社区内部的交互要远远地比子社区之间的交互更为紧密。但是通过这种算法得到的子社区的结构往往缺乏语义上的解释,且会将一个科研人员仅限定在一个子社区内。本文借助LatentDirichletAlloCUTion模型,提出了综合利用社区中成员间的交互关系和用户间交互的内容信息的社区发现算法。该算法克服了基于图论的社区发现算法的不足,它不仅可以提取出子社区的结构,还可以得到以主题表示的子社区中用户共同的兴趣,从而可以解释为什么这些用户会组成联系紧密的子社区。1LatentDirichletAlloCUTionLatentDirichletAlloCUTion(LDA)模型[5]是一种生成式概率模型,其基本思想是假设存在K个(隐)主题,其中每个主题是在不同词上的分布,而文档又可看