1 / 66
文档名称:

面向复杂网络的社区发现算法研究.pdf

格式:pdf   页数:66
下载后只包含 1 个 PDF 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

面向复杂网络的社区发现算法研究.pdf

上传人:coconut 2014/4/8 文件大小:0 KB

下载得到文件列表

面向复杂网络的社区发现算法研究.pdf

文档介绍

文档介绍:中国科学技术大学
硕士学位论文
面向复杂网络的社区发现算法研究
姓名:姜秀芳
申请学位级别:硕士
专业:计算机应用技术
指导教师:刘贵全
2011-04
摘要
摘要
复杂网络,其实就是复杂系统的一种抽象,复杂系统中的个体可以看成是网
络中的节点,而系统中个体之间按照某种规则而自然形成或人为构造的一种关系
就是节点之间的边。在现实世界中,复杂网络真的是处处可见。换言之,许多领
域的系统都可以看作是复杂网络:从科技系统,如
生物系统,如新陈代谢网络和生态网络;再到社会系统,如科学家合作网络和在
线社区网络等等。而发现网络中的社区结构即社区发现技术是理解复杂网络过程
中至关重要的一步,它不仅帮助我们了解该网络的结构,而且帮助我们分析该网
络的特性。社区发现技术同时也广泛应用在生物学、物理学、计算机图形学和社
会学等领域中。其不仅仅在理论研究方面具有很高的学术价值,在实际生活中也
有着十分重大的实用价值。另外,社区还可以为用户提供一些可靠、及时并且有
价值的信息。
本文首先介绍了现有的社区发现技术的一些理论知识,然后回顾了一些早期
的经典社区发现算法如 Kernighan-Lin 算法、谱分析思想以及层次聚类方法中的
GN 分裂算法和 Newman 快速凝聚算法,同时还跟踪了一些近两三年提出的新算
法如 Zhenqing Ye 等在 2008 年提出的适应性聚类算法、Andrea ti 等在
2009 提出的基于适应度函数的社区结构发现算法以及 Rumi Ghosh 等在 2010 年
提出的使用全局影响力度量标准的社区发现算法。对于这些算法,我们分析了它
们的优势,也指出了其不足,并且还分析了算法的复杂度以及适用范围等。
在理解现有算法的基础上,我们在本文中提出了两个新的发现网络社区的有
效方法:1)基于社区紧密度的快速发现算法 和 2)随机游走策略 RMS。
其中, 算法的提出,是为了解决现有算法的“大计算量,高复杂度而导
致的难以应用在大型社会网络中”的问题。算法不仅能够有效地发现社
区,而且时间复杂度也很低(接近线性)。而 RMS 算法的提出,有以下几方面原
因:1)传统的社区结构发现算法,只能得到网络在某个单一层次下的社区结构,
而不能完整地给出网络在多个层次下的社区划分状况;2)使用这些算法来划分
具有重叠社区结构的网络时,往往也会显得力不从心,并且所获得社区的质量也
不是很高;3)这些算法都没有对重叠社区中具有多重身份的节点进行定量地分
析,这将隐藏一些重要的信息,并且经常导致划分不正确。我们引入的 RMS 算
法不仅可以发现网络中的重叠社区,而且也能发现网络在不同层次下的社区结
构。munity Tendency,简称 CT)的概念,使我
们可以定量地描述重叠社区,进而发现网络中的一些隐藏的重要信息,并且得到
I
摘要
合理的划分。简言之,RMS 可以帮助我们从多个角度来分析和理解网络,从而
得到该网络中关于社区结构方面的详细信息。我们的仿真实验结果也验证了这两
个算法发现社区的有效性和高效性。

关键词:复杂网络社区结构社区发现重叠社区社区倾向性
II
ABSTRACT
ABSTRACT
works are kind of abstraction plex systems for the individuals
in a system can be modeled as nodes, and relations or links among individuals in the
system as edges in the graph. In other words, numerous systems in real world can be
considered works. Typical cases are listed below: from WWW to
worldwide works in the area of technology, from works to
ecological webs in the area of biology, and from scientific work to
on-munities(. Facebook) in the area of society.
mon characteristic of works is that subgroup of nodes consisting
of tightly connected units, named “communities”. Ho