文档介绍:如何选择知识管理系统的数据库平台
知识管理系统(KMS)通过IT技术为企业提供知识管理服务,实现企业显性知识和隐性知识、内部知识和外部知识的获取、沉淀、共享、学习、应用和创新,实现知识创造价值。
知识管理系统(KMS)通过IT技术为企业提供知识管理服务,实现企业显性知识和隐性知识、内部知识和外部知识的获取、沉淀、共享、学习、应用和创新,实现知识创造价值。知识管理系统中的知识主要由二种数据结构存在,一是用以描述知识属性和本体的结构化数据,二是以文档、邮件、多媒体等开工存在的非结构化数据。如何选择合适的数据库平台实现二类数据的有效处理将成为KMS系统成败的关键要素之一。
一、数据处理主流技术分析
在数据处理领域关系型数据库(RDB)技术处于统治地位,它以关系数学、简单的关系模型为基础,以SQL为处理工具,得到了广泛的应用,其技术特征决定更擅长结构化数据处理应用,近年来各厂商在关系型数据库基础上拓展功能,开始具有内容管理、多媒体等数据处理能力。典型的产品包括Oracle、DB2、SQL Server、MySQL等。而针对海量结构化数据处理,则还有如ESSBase、Cognos等多维数据库系统。
在文档等非结构化数据处理方面,则以文档型数据库为领先,具有海量特性,不受字节数的限制,任何图形、声音信息,无论其大小、长短、高低,都只是这一数据库中一个的组成元素而已,IBM Lotus Domino则是在存储这类非结构化数据方面具有业界公认优势的产品代表。
以下是关系型数据库与文档型数据库的简单比较:
    针对特殊应用领域还有一些专用数据库技术,如空间数据库等技术。
二、KMS系统主流数据库应用分析
当今的KMS系统采用的主流技术主要有IBM Domino、SUN JAVA、Microsoft .net三大体系,Domino以电子邮件、协同、非结构文档处理、安全机制见长,JAVA以开放标准正引领技术方向,.net以简单、灵活、易用、低成本也广受亲睐。
在KMS的数据处理方面则有二大阵营,一类是ORACLE/DB2/SQL SERVER等关系型数据库,另一类是Domino等文档型数据库。
Domino具有高效的文档处理能力,具有多达7层(管理者、设计者、编辑者、作者、读者、存放者、不能存取者)的安全控制机制,可以实现服务器、某个数据库、某个视图、某个表单、某个操作、某一篇文档或某个字段等的权限控制,可以跟踪并记录所有用户对数据库和文档的各种操作等突出优势,非常适合KMS系统中对文档型知识的管理。但是面对大量表单等结构化数据处理需求时,计算、统计能力差的Domino则难以应对。
关系型数据库则擅长结构化数据处理,具有卓越的计算、统计性能,但面对大量的文档处理时(据统计研究表明,KMS系统处理的文档型数据约占整个数据处理的70-80%),也会暴露出明显的问题。
就目前比较成熟的技术而言,RDB处理文档数据通常有二种方法:
    方法一:将文档以文件形式存放在操作系统的文件系统中,关系型数据库仅存放文档具体存放的位置信息,当文件组织合理时,由于直接访问文件系统,性能非常好,全文搜索等文档管理功能也容易实现,但其缺点也很明显,主要是:
1. 导致操作系统文件数量巨大,系统管理员管理复杂;
2. 文档安全性