文档介绍:(2011届)
毕业论文(设计)
文献综述
题目: 科学知识图谱在学科评价中的应用研究
学院: 商学院
专业: 信息管理与信息系统
班级:
学号:
姓名:
指导教师:
开题日期:
前言部分
随着信息技术、可视化技术和科学计量学、文献计量学理论的发展,以图形的方式来揭示学科间的联系已不再是一件难事。而近年来科学计量学、文献计量学研究领域兴起的热点之一,就是如何在准确、翔实地传达知识的基础上以可视化的图像直观、形象地向人们揭示学科以及学科之间的联系。在信息技术推动下,新近发展出来的一个新领域——科学知识图谱。虽然我国对科学知识图谱研究起步较晚,但根据对陈超美教授关于可视化软件Cite space的网站访问统计,2008年我国排在世界第二位,%,而2009年攀升为第一,%。这从一定程度上说明,知识图谱已引起我国学者的广泛关注,2008年大连理工大学WISE试验室研究团队出版了国内第一部关于科学知识图谱和知识可视化的学术专著学《知识图谱:方法与应用》,掀起了中国关于科学知识图谱研究的热潮。
二、主题部分
1 科学知识图谱的产生与发展
科学知识图谱,是将传统的文献计量方法与现代的文本挖掘和复杂网络、数学、统计学、计算机科学方法以及可视化技术等有机地整合在一起的一种综合分析科学发展的知识发现方法[1]。从20世纪 50年代至今,科学知识图谱的研究已经有几十年的历史。
(1)引文分析理论的发展促进了科学知识图谱的兴起。20世纪60年代,加菲尔德(Eugene Garfield)创办科学引文索引(SCI)。1965年,普赖斯以SCI为数据来源,发表了一篇科学计量学的杰作《科学论文的网络》。在这篇论文中,普赖斯第一次提出并界定了“研究前沿”的概念[2]。到了20世纪70、80年代,(Tibur Braun)、(Wolfgang Glanze1)(Andres Schubert)以SCI数据库为基础,出版了《科学计量学指标》,这实际上是世界科学地图和科学知识图谱的雏形。
(2)复杂网络系统和社会网络分析的兴起丰富了引文分析理论与方法。美国社会心理学家斯坦利·米尔格兰姆(Stanley Milligram)于1967年通过社会网络人际关系的“六度分隔”试验发现了著名的“小世界”现象[3]。90年代中期,比利时情报计量学专家埃格赫(Leo Egghe)和鲁索(Ronald Rousseau)合作出版了《情报计量学引论》,促进了科学知识图谱的产生。进入21世纪,社会网络分析的探索与应用向纵深发展,风靡全球。
(3)信息可视化为科学知识图谱提供了强大的技术支持。1999年陈超美出版了该领域的第一部学术专著《信息可视化与虚拟环境》,(Robert Spence)2000年出版了《信息可视化》之后相关研究如雨后春笋般涌现。
科学知识图谱的应用离不开引文分析和可视化技术。近年来,随着计算机技术的迅猛发展及应用,引文分析和可视化领域都取得了长足的进步,许多新的技术被广泛应用于文献、专利、基因图和其他信息类型的可视化分析,产生了许多新的研究成果,为科学知识图谱的绘制提供了新的、可靠的理论、方法和技术支持。其中最引人注目的是数据可视化、信息可视化和引文分析可视化及其应用研究。将引文分析可视化和科学知识图谱的重要应用前景展现在人们眼前,倍受信息管理界、科学界和科研管理界的关注和青睐。
2 构建知识图谱的方法
科学知识图谱是可视化显示知识资源及其关联的一种图形,可以绘制、挖掘、分析和显示知识间的相互关系,在组织内创造知识共享的环境,从而最终达到促进知识交流和研究深入的目的。构建知识图谱的方法有以下几种:
(1)引文与共被引分析
所谓引文分析是指利用数学、统计学和比较、概括、归纳等方法对科学期刊、论文、作者等各种对象之间的引用与被引用关系进行分析,以揭示分析对象内存在的数量特征和内在规律的一种文献计量研究方法。通过引文间的网状关系进行研究,能够探明有关学科问的关系和某些发展规律。目前引文分析大致有3种基本类型:①从引文数量上进行研究,主要用于评价期刊、论文、机构、作者及地区的科研水平;②从引文间的网状关系或链状关系进行研究,主要用于揭示学科的发展与联系,并展望未来前景等;③从引文反映出的主题相关性方面进行研究,主要用于揭示科学的结构和进行文献检索等。
(2)共词分析
共词分析属于内容分析法的一种。它的原理主要是对一组词两两统计它们在同一篇文献中出现的次数,以此为基础对这些词进行聚类分析,生成共词文献簇,进而分析这些词所代表的学科和主题的结构变化[4]。它利用大量文献中共同出现的关键词可以有效地反映文