文档介绍:一技一◆。≯
文/刘晓光
非结构化档案信息及
档案异构数据库管理系统的研究
随着信息化进程的深入和加快,特
别是电子政务建设的稳步推进,各行各业
产生了各种数据类型的电子文件、电子档
案,如何科学有效管理这些非结构化和
不同数据库结构的档案信息是各级档案
馆面临的迫切问题。与结构化档案数据相
比,非结构化档案数据的数量增长速度
更快,管理难度也更大。调查显示,全球
数据量的%都是非结构化数据,针对非
结构化档案数据的归档和归档后的管理
成了档案信息化工作的当务之急。为此,
国家档案局档案科学技术研究所在财政
部申请了科研专项课题——“非结构化
档案信息及异构数据库管理系统研究”,
以探索较佳的档案信息整合模式,实现对
分散在各地档案部门异构的、非结构化的
开放档案信息资源进行有效整合、安全存
储、高效维护、便捷利用。该课题获年大型网络应用系统在架构选型上基手,各地方档案馆按要求到中心服务器
国家档案局优秀科技成果一等奖。本文本可以分为两大类型,即集中式与分布注册;
主要对总体架构的选择和优化、信息交换式,两种方案的基本思想如表所示。各地方档案馆自己维护索引服务,
平台和档案资源利用平台进行介绍。综合集中式架构与分布式部署方案全文数据;
一的优点,尽量避免不同构架的缺点, 各地方档案馆提供索引查询服氖
一结合各地档案馆实际建设情况,经全面开放接口,中心服务器通过
、总体架构的选择和优化
考虑,项目提出并采纳了分布式构架方的方式检索文件;
课题对三种系统架构模式进行了比案二。各地方档案馆提供全文展示服务
较,最终选择了一套适合本课题的系统架基本实现思想是: 站点;
构模式。中心服务器主要从管理的角度入中心服务器提供门户、档案检索服
玎国挡薷.
离
供查询服务,并且向普通用户提供指定
信息的档案浏览功能。具体架构设计用图
表表示:
子站点具有数据维护、查询服务、索
引创建、档案信息浏览类功能。
.既有异构档案数据和非结构化档
案信息的使用方案
既有的异构档案数据,可以分为基
础数据库和特色档案数据库两部分,为此
课题组定义了基础数据库的结构,以便于
开放档案信息资源的利用。
基础数据库。对于基础数据库的
档案数据,子站点软件预先在系统中预装
表结构,并提供标准的导人导出工具,安
装软件后可以立即进行标准数据的导人
工作。..导出工具提供通过中间文件和
直接对数据库导入两种方式。中间文件导
人的具体操作方式是:先将既有数据库
中的数据导出到预定义格式的文本
文件中,如果数据量大可以根据主键分批
务、系统后台管理平台。导出,再导入到新数据库中;直接数据库
分布式方案二表具备以下优点: 二、信息交换平台导入的处理方式是:在应用系统中,提供
中心服务管理方便,中心服务器管设置新旧数据库字段对应关系的功能,并
理人员主要负责管理与审核等工作; 课题对子站点的架构进行了设计,提且可以根据主键灵活指定导入计划,可一
系统建设资金投入比集中式架构出了既有数据的使用方案,开发了中心服次导人或分批导人。
需要的软硬件配置大大降低; 务器后台管理平台。特