1 / 41
文档名称:

引文分析法共词分析法浅析.ppt

格式:ppt   页数:41页
下载后只包含 1 个 PPT 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

引文分析法共词分析法浅析.ppt

上传人:875845154 2015/12/30 文件大小:0 KB

下载得到文件列表

引文分析法共词分析法浅析.ppt

文档介绍

文档介绍:引文分析法、共词分析法浅析
于伟
科学研究前沿代表了科学发展的难点、热点以及发展趋势,从浩瀚的科技信息中探测研究前沿是科技创新的关键任务之一。因此,如何能够科学、准确地把握研究前沿已经成为科学研究人员及其管理者关注的焦点。
科学家提出各种方法与技术用于探测研究前沿,其中以利用引文分析和共词分析的研究最为常见。
引文分析
引文分析是利用各种数学、统计学以及逻辑方法,对科技期刊、论文、著作等各种分析对象的引用或被引用现象进行分析研究, 以便揭示其数量特征和内在规律, 达到评价、预测科学发展趋势的目的。近几年主要的关注研究对象或热点集中在“引文网络”、“自引与自引率”、“共引分析”、“影响因子”以及“引文分析和统计中的误差”等方面。
在引文分析中, 引文网络得到了学者们的高重视。国外方面,将引文看作代表信赖的原型。他们认为在虚拟环境中,引文实际上代表了一种信赖。当A 引用B 的文章时,A认为B 的观点是支持性的,而B 引用的内容是被协商许可了的, 引用内容的同时也就影响了B 的思维。因此,引文网络系统可以被看成是信赖系统,引文索引则可以被看成是一个推荐系统———推荐被引次数多的文章。
引文网络
在引文网络中存在大量的同引和耦合。同引(或称同被引)是指两篇或两篇以上文献共同被之后的一篇或多篇文献引用,如图中5和6同时被之后的8和8′引用;引用它们的论文的多少,即同被引程度,称为同被引强度。耦合则是指两篇文献共同引用了一篇或多篇文献,如图中2和4共同引用了1;耦合的文献之间总存在着这样或那样的联系,其联系的程度称为耦合强度。
引文网络的结构特点有: ①引文网络是静态的,不可以在任何已有节点上增加新的代表引用的单向箭头,也不可以随意删除已有的代表引用的单向箭头,因为文献一经出版之后,它的参考文献就一成不变了; ②引文网络中的引用是单向的,即只能是后期的文献引用前期的文献,而前期的文献不能反过来引用后期的文献; ③引文网络中的引文不可以自引,引文不能自己引用自己,在引文分析中,自引主体只能是作者、期刊、学科、机构等; ④引文网络中的引用是有固定时间的,即文献A引用文献B是有固定时间的,这个固定时间正好是文献A 的发表时间,且文献A的发表时间必然在文献B之后,如图3中8和8′同时发表,故不存在8引用8′或8′引用8; ⑤引文网络中引文间的引用呈现出主题集中,因为引文间引用的正式性和文献出版的质量控制,引文基本来自同一科学领域或关系紧密的领域。
常见的引文网络测度指标可以分为四类: ①引文数量特征测度指标:引文数; ②引文分布特征测度指标:平均引用数、自引数与自引率、被引次数与引用数的比值; ③期刊(论文)影响力测度指标:被引用数、同引和耦合、期刊影响因子即年指标; ④文献老化规律测度指标:衰减系数等
自引自引率
关于自引和自引率的研究是引文分析的内容之一。目前在国外研究最多的是关于期刊的自引和自引率。一般认为, 期刊高自引有助于提升其影响因子; 也有研究人员研究去除期刊自引数对影响因子的影响,认为未去除影响因子的数据可以采用;还有研究显示期刊自引与自引率与影响因子的负相关性。
共引(co-citation)
就是两篇文献同时被其他文献引用。一般认为同被引用的文献在主题上具有或多或少的相似性, 因此同被引次数即共引强度可以测度文献在内容方面的相关度。由此, 通过一组文献之间的共引关系可以形成共引网络, 该网络内节点之间的远近便可以反映它们主题内容的亲疏关系。