文档介绍:·
计 算机科 学 塑
数据集成综述
数据集成难点
存 在 。 “ 信 息孤 岛 ”造 成 系 统 中存 在 大量 冗 余数据 、 垃 圾 数 据 , 数据集成 的难 点 ’〕可 以 归纳 为 以 下 主 要方 面
无法保证数据的一致性 , 从而 降低信 息的利 用 效率和 利 用率 异 构 性 被集成的数据 源通常是独 立 开 发的 , 数据模
, 。
为解 决这 一 问 题 人 们开始关注 数据集成 研 究 数据 集成 的核 型 异构 , 给 集成 带 来很 大 困难 。 这些 异构性 主 要表 现 在 数据
,
心 任 务 是 要将互 相关 联 的 分 布 式 异 构数 据 源集 成 到 一 起 使 语义 、 相 同语义 数据 的表达形式 、 数据源 的使 用 环 境等 。
。
用 户能 够 以 透 明的方 式 访 问 这些 数 据源 集 成是 指 维护 数 分 布 性 数据源是异地分 布的 , 依赖 网 络传输 数据 , 这
、
据源整体 上 的数据 一致性 提 高 信息共享利 用 的效率 透 明的 就 存 在 网络传输 的性能和 安全性等 问 题 。
,
方式 是 指 用 户 无 需 关 心 如何 实现 对 异构 数 据源数 据 的 访 问 自 治 性 各个 数据源有 很 强 的 自治 性 , 它 们 可 以 在 不
只 关 心 以 何 种方 式 访 问 何种 数 据 实 现 数 据 集 成 的 系