文档介绍:
基于大规模复杂网络社区发现的科研合著
网络分析#
武森,卢丹,冯小东,杜彦南*
5
10
(北京科技大学东凌经济管理学院,北京 100083)
摘要:针对基于极大团的社区发现算法,设计适应大规模数据的 MapReduce 并行计算框架,
提出基于大规模复杂网络社区发现的科研合著网络分析算法,并用于对我国管理科学与工程
领域 2012 年的科研合著网络进行社区结构划分。实验结果表明,基于 MapReduce 的并行社
区发现算法在保证正确性的同时能够有效地提高计算效率,适用于大规模复杂网络的社区发
现,针对我国管理科学与工程领域 2012 年科研合著网络的社区划分结果展现了我国管理科
学与工程领域科研合作的特点和问题。
关键词:科研合著网络;社区发现;MapReduce;
中图分类号:TP391
15
Scientific Co-work Analysis Based on
Community Detection in Large-work
WU Sen, LU Dan, FENG Xiaodong, DU Yannan
(Dongling School of Economics and Management, University of Science and Technology Beijing,
20
25
30
35
40
Beijing 100083)
Abstract: In this paper, we design a puting framework using MapReduce and present
a scientific co-work analytical algorithm by mutities in large-scale
work with reference to munity detection algorithm based on maximum clique.
Then we use the proposed algorithm to detect munity structure of domestic scientific
co-work in the field of management science and engineering in 2012. Experimental
results show that the munity detection algorithm based on MapReduce can not only
ensure the correctness but also improve the efficiency of putation. Thus, this algorithm can
be used to munity structure in large-work. munity structure
detection results of domestic scientific co-work in the field of management science
and engineering in 2012 illustrate the features and problems of domestic scientific collaboration in
the field.
Key words: scientific co-work; community detection; MapReduce
0 引言
在现实世界中,存在着各种各样具有复杂连接关系的网络,如因特网、交通网、人际关
系网等。许多研究表明,复杂网络除了无标度[1]和小世界[2]等特性外,还具有社区结构特性
[3]
区结构逐渐引起研究者的关注。社区发现算法主要包括图分割算法和分层聚类算法。图分割
算法主要包括 Kernighan-Lin 算法[4]和谱平分算法[5];分层聚类算法中,Newman 等人提出的
GN 算法[6]最为经典,但 GN 算法虽然准确度较高,可其算法复杂度比较大,因此仅仅局限
基金项目:教育部科技发展中心网络时代的科技论文快速共享专项研究资助课题/高等学校博士学科点专项
科研基金博导类资助课题(20120006110037);国家自然科学基金(71271027);中央高校基本科研业务
费专项资金(FRF-TP-10-006B)
作者简介:武森(1971-),女,教授,博士生导师,主要研究方向为数据仓库与数据挖掘.
******@.
-1-,每个社区内部联系紧密,而社区间联系则相对稀疏。如何在大规模的复杂网络中发现社