文档介绍:
基于标签相似度的协作者推荐研究
陈翔,邱秀珍
(北京理工大学管理与经济学院,北京,100081)
摘要:针对目前虚拟协作社区中重视交互行为研究,缺乏协作行为研究的问题,从项目和协
作者的角度出发研究社区的标签关系,提出根据协作者与项目的发生关系和项目标签集合获
取基于协作者的标签共生信息,并用该共生信息来计算标签之间相似度,然后提出一种新的
协作者工作偏好模型。结合协作者工作偏好和标签相似度研究协作者之间的关系,以及协作
者与项目之间的关系,预测可能参与项目的协作者,提出协作者推荐算法。通过使用开源社
区进行实验,并与其他推荐算法进行比较,证明本文提出的推荐
算法能较好地应用于协作者推荐。
关键词:标签相似度;虚拟协作;协作者推荐;开源社区
中图分类号:TP
文献标志码:A
Tag similarity-based cooperator mendation
Chen Xiang, Qiu Xiuzhen
(School of Management and Economics, Beijing Institute of Technology, Beijing 100081, China)
Abstract:At present, researches on virtual munity emphasize more on interactive
behavior but ignore collaborative behavior. To address this issue, we study the tag relationship from the
view of the project and cooperator, and obtain the cooperator-based co-occurrence information by the
cooperator-project relationship and project tag collection. Then we use this co-occurrence information
to calculate the similarity between tags. Based on these, this paper also introduces the method of
measuring the similarity of work preferences between cooperators and calculating the matching degree
between cooperators and projects. The acquired information can then be used in cooperator
mendation algorithm. Finally, by using the open munity data from
comparing with other algorithms, this paper tests and verifies that the
proposed mendation algorithm can well forecast collaborative behavior.
Key words : tag similarity; virtual collaborative; cooperator mendation; open source
community
0 引言
社会计算激发了用户交互、共享、协作和进行推荐的意愿[1],随着社会网络和协作计算
的各类应用的迅速发展,出现了越来越多的协作共享社区站点。例如,在全球最大的开源服
务社区网站 e 上,目前约有 340 万开发人员在 万个项目上创建了各种功能的
软件服务,约有 4 600 多万的软件消费者通过目录服务与这些软件开发项目相连,每天有超
过 400 万的下载量。其他的类似网站还有 codeplex、Google code、e 和 Gitorious
等等。而且,在这些协作共享社区网站上的服务和注册人员的数目每天还在递增,社会网络
规模日趋庞大。社会网络已经渗透到商务协作开发、集成和推荐的全过程,基于社会网络研
究协作流程和协作专家推荐等问题,是必然的技术发展趋势。
基金项目:国家自然科学基金( 71102111)
作者简介:陈翔(1976-),男,副教授,主要研究方向:计算机软件及计算机应用,******@bit.
-1-
用户模型是协同过滤算法的基础,而用户兴趣模型大都基于原始评分矩阵。