文档介绍:学术不端文献检测系统培训手册
学术不端文献检测系统
培训手册
1
学术不端文献检测系统培训手册
抄袭有风险
论文勿抄袭
检测联系 qq895973990
2
学术不端文献检测系统培训手册
第一章系统简介
系统概述
学术不端文献检测系统(简称“AMLC”)以《中国学术文献网络出版总库》为全文比对数据库,实现
了对抄袭与剽窃、伪造、篡改等学术不端行为的快速检测,可供用户检测论文,并支持用户自建比对库。
其系统示意图如图 1 所示。
图 1 检测系统示意图
系统技术路线介绍
AMLC KI 自主研发的自适应多阶指纹(AMLFP)特征检测技术,具有检测速度快,准确
率,召回率较高,抗干扰性强等特征。
支持篇章、段落、句子各层级检测;
支持文献改写,多篇文献组合等各种文献变形检测;
支持研究生论文、图书专著等超长文献的学术不端检测。
CNKI 自适应多阶指纹技术原理如图 2 所示:
图 KI 自适应多阶指纹技术原理图
3
学术不端文献检测系统培训手册
对任意一篇需要检测的文献,系统首先对其进行分层处理,按照篇章、段落、句子等层级分别创建指
纹,而比对资源库中的比对文献,也采取同样技术创建指纹索引。这样的分层多阶指纹结构,不仅可以满
足我们对超长文献的快速检测,而且,因为我们的最小指纹粒度为句子,因此,也满足了系统对检准率和
检全率的高要求。原则上,只要检测文献与比对文献存在一个相同的句子,就能被检测系统发现。
系统功能概述
系统主要功能包括:已发表文献检测、论文检测、问题库查询、自建比对库管理等。
◆已发表文献检测:指检测系统能够自动将属于用户的已正式发表的论文检索出来,并对每一篇已发
表文献进行实时检测,快速给出检测结果。
◆论文检测:主要实现论文实时在线检测功能。
◆问题库查询:指用户可以将检测结果中确认有问题的文献放入到问题库,便于用户集中管理。
◆自建比对库:指管理人员可以选择将检测文献放入个人比对库或者批量上传文献作为个人比对库,
该个人比对库即可作为以后学术不端文献检测的比对数据库,该自建个人比对库完全属于用户,其他用户
无权使用。
系统目的
AMLC 的目的是提供辨别和处理学术不端文献的能力,为审查论文提供技术服务。检测系统在对论文
进行检测之后,生成检测报告,为判断论文性质提供相关依据。
第二章检测原理及方法
支撑技术
CNKI 拥有强大的技术研发队伍,目前已经拥有了具有国际或国内领先水准的全面的数字出版的相关
技术,包括资源采集技术,文本数据库加工技术,文本数据库技术, 数字资源版权保护技术, 知识挖掘技
术, 自然语言处理技术、快速比对技术等。在海量的全文数据的基础上实现快速准确的检测,上述技术是
基本的保证。
支撑资源
AMLC 需要一个尽可能完备的全文数据比对资源库,KI 的《中国学术文献网络出版总库》则正
好满足这一要求。KI 拥有学术期刊 7000 余种,期刊全文文献 2480 万篇,期刊期数和文
献收录完整率都大于 %,文献量居国际国内同类产品之首;出版 503 家硕士学位点的 72 万篇优秀硕士
论文,368 家博士学位点的 万篇博士论文;1286 家重要会议论文 106 万篇;515 家重要报纸 500 多万
篇;1376 种重要年鉴 787 万篇;600 多种工具书 220 多万条;学术引文索引数据 600 多万条;这些出版物
做到平均日更新 20000 条记录;国家标准、专利、SPRINGER KI 网络出版平台中;另
外,出版平台还集成整合出版了各类第三方数据库资源 1020 种。
KI 在国内具有明显优势,收录了期刊、论文、会议论文、报纸、年鉴、工具
书、专利、外文文献、学术文献引文等与科学研究、学习相关的主要资源。KI 明
显优于同类产品,各个资源库收录年限长,期刊等主要资源库回溯到创刊。KI 产
4
学术不端文献检测系统培训手册
品除了第三方合作的外文文献以外,其他资源都做到了日更新,单日更新数量大,这是推行产业化、标准
化运作的结果。
系统架构模式
系统架构图
图 3 系统架构图
系统示意图
检测系统提供整套的文献学术不端行为检测,KI 中心网站,用户将待检测的论文
通过网络在线提交到中心网站服务器,服务器在检测完成后,自动将检测结果返回给用户。整套系统架构
为 B/S 结构,客户端不需要安装任何软件。其系统示意图如图 4 所示:
5
学术不端文献检测系统培训手册
用户 1 用户 2 用户