文档介绍:文献计量法与引文分析法
目录
一、文献计量学概述
文献计量学发展历史
文献计量学发展趋势
二、文献计量学方法
文献计量学三大定律
文献增长规律
文献老化规律
三、引文分析法
文献计量学概述
文献计量学的发展历史
文献计量学的发展历史最早追溯到1911年,俄国化学家瓦尔金用引文分析法研究了一些国家的化学家所做的贡献。
1917年,文献学家科尔和伊尔斯在《科学进展》期刊上发表文章,通过分析研究比较解剖学文献,介绍了最基本的书目统计分析技术。
1923年,休姆提出了统计书目学。自此,文献计量的研究活动日益活跃。
1926年,美国数学家、化学家洛特卡在题为《科技生产率的频率分布》一文中首次阐述了著者与文献数量的关系,并建立了数学模型,即洛特卡定律。
1934年,英国情报文献学家布拉德福提出了定量描述文献序性结构的经验定律,揭示了定期出版物中文献分布规律。
1935年,美国语言学家齐普夫通过大量的统计分析工作,从而宣告了齐普夫的词频分布定律的正式诞生。
文献计量学的发展历史
1969年,普里查德()发表了《统计书目学还是文献计量学》一文,首次提出了文献计量学这一概念。从此之后,文献计量学这个术语代替统计书目学得到广泛应用。普里查德在这篇文章中对文献计量学下了定义——“文献计量学是把数学和统计学应用于图书和其他交流媒介的一门学科”。
文献计量学:用数学和统计学的方法,定量地分析一切知识载体的交叉科学;集数学、统计学、文献学为一体,注重量化的综合性知识体系;
其计量对象主要是:文献量(各种出版物,尤以期刊论文和引文居多)、作者数(个人或团体)、词汇数(各种文献标识);
文献计量学概述
文献计量学的发展趋势
网络和网络计量的研究日益成为文献计量学的研究前沿;
文献计量学内容体系中的指标, 从提出到现在一直都是文献计量学研究的热点, 目前有关指标的研究是文献计量学研究前沿, 且以指标的应用为主要的研究前沿;
文献计量学呈现与其他学科相结合的趋势, 特别是医学。
文献计量学研究日益呈现应用化、综合化和网络化的态势。
文献计量学方法
文献计量学三大定律
1、文献作者的分布理论--洛特卡定律
2、文献分散的理论--布拉德福定律
3、词频分布理论--齐普夫定律
洛特卡定律
洛特卡定律的产生
1926年,洛特卡最先研究了科学文献数量与著者数量之间的关系,并创造性地提出了“科学生产率”的概念。所谓“科学生产率”是指科学家(科研人员)在科学上所表现出的能力和工作效率,通常用其生产的科学文献的数量来衡量。洛特卡就是从“科学生产率”这个概念出发,通过统计和分析科研人员的论著数量,首次揭示了科学文献按著者的分布规律。
洛特卡围绕科学生产率这个崭新的课题,为了考察文献作者分布规律做了大量艰苦的统计工作。他选取化学和物理两门学科的论著数量和著者数量为研究对象。
洛特卡对这些数据的统计结果包含两部分内容:1、与论著数量相对应的作者数量;2、著者频率,即相应的著者数占著者总数的百分比。这两个部分均按论著数量增序排列。
在对数据的研究过程中,洛特卡发现,科学领域的论著数量与著者频率有一定的关系。他在《科学生产率的频率分布》一文中,论述了化学与物理学领域中作者频率与论文数量的分布规律,提出了描述这两者关系的一般公式,同时还阐明了科学生产率的经验规律,即洛特卡定律(Lotka’s Law),又称“倒数平方定律”。
洛特卡定律
洛特卡定律基本内容
从洛特卡定律的产生过程可以看出,该定律的目的和基本内容是:描述科学工作者人数与其所著论文之间的关系。
如果设f(x)为写了x篇论文的作者数占作者总数的比例,则洛特卡定律可表示为:
其中,C和a是某特定主题领域的特征常数。
洛特卡统计的数据约:a=2,即“平方反比率”。
洛特卡定律
洛特卡定律基本内容
f(1)=C=6/π2:写一篇论文作者的数量约占所有作者数量的60%;
f(2)=C/4:写两篇论文的作者数量约为写一篇论文的作者数量的1/4;
f(3)=C/9:写三篇论文的作者数量约为写一篇论文作者数量的1/9;
f(n)=C/n2:写n篇论文的作者数量约为写一篇论文作者数量的1/n2……
洛特卡定律
洛特卡定律的局限性
只是根据化学和物理学两大学科得出的理论估计,并非精确的统计分布,在其他学科的应用时就需要作一定的修正。
洛特卡的数据抽取方法有欠科学,只有在研究的学科满足以下条件时预测结果才会比较客观:学科必须相对稳定、研究的论文时间区间必须足够长、研究的作者数目必须足够大。否则对该定律必须作相应的修正。