1 / 5
文档名称:

国内主题词表探究热点和趋势-基于词频统计和知识图谱方法.doc

格式:doc   大小:63KB   页数:5页
下载后只包含 1 个 DOC 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

国内主题词表探究热点和趋势-基于词频统计和知识图谱方法.doc

上传人:pppccc8 2020/2/28 文件大小:63 KB

下载得到文件列表

国内主题词表探究热点和趋势-基于词频统计和知识图谱方法.doc

相关文档

文档介绍

文档介绍:国内主题词表探究热点和趋势:基于词频统计和知识图谱方法摘要:通过1980年〜2003年和2004年〜2011年两个时间段的词频统计与可视化知识图谱等方法的比较分析与研究,展现了国内主题词表研究领域的热点和趋势,认为:国内对主题词表的研究内容在时间上有明显的分界线、研究趋势展现了知识组织的演化过程、主题词表基于语义描述语言的本体转换是目前学界研究的热点和未来研究的趋势。关键词:主题词表;词频统计;知识图谱;研究热点;研究趋势Abstract:parativeanalysisandresearchintwoperiodsof1980一2003and2004一2011,thearticleshowstheareasofresearchfocusandtrendsofThesaurusinChina・Thatis:thereisacleardividinglineintwoperiods,anizationsystem, :Thesaurus;WordFrequencyStatistics;KnowledgeMapping;ResearchFocus;ResearchTrends1引言主题词表(叙词表)是一种情报检索语言,它在早期情报检索和知识组织中发挥着非常重要的作用。早在1876年,美国图书馆学家卡特发表了他的《字典式目录条例》[l]o而随着计算机技术的发展,主题词表的功能也发生了相应的变化。另外,不断更新的网络技术,以及语义网等概念的技术实现,也为主题词表的发展注入了活力。国内主题词表研究虽然起步较晚,但从《汉语主题词表》的问世,到《中国分类主题词表》的出版,均取得了卓越的成就。国内的研究主要集中在主题词表的介绍、评价、编制、修订、标引方法、应用及分类主题一体化等领域[2][3][4],另外,随着计算机网络技术的发展,各类词表被大量应用到了信息检索技术、知识组织与管理等领域之中[5][6]。那么,这些年来国内对主题词表的研究都触及了哪些主题?其研究的趋势和热点又在哪里?本文试图通过对发表在期刊上的学术论文进行研究,旨在为该领域同行了解和掌握研究方向提供些许帮助。2样本获取与研究方法1样本获取方法。本文获取数据样本的方法是:在“中国学术期刊网络出版总库”中,用关键词“主题词表OR叙词表”,检索出1980年〜2011年间发表在"核心期刊”上的论文,因为《中文核心期刊要目总览》第一版在1992年才出版,上述检索结果仅命中了1992年〜2011年数据;因此,作者又补充了1980年〜1991年的相关主题数据。经过人工筛选,最后,获得样本数为480篇(检索日期:2012年2月12H)o2研究方法。本文主要应用文献计量学领域的词频统计方法和基于共词的可视化知识图谱方法。通过关键词词频的动态统计与分析,可以反映出某时间段内研究主题的动态变化过程,如高频关键词的发展期、高峰期及衰退期等。词共现(共词)[7]。在词共现分析方法的基础之上,我们可以运用