1 / 21
文档名称:

数据仓库商业智能相关面试题带答案.docx

格式:docx   大小:29KB   页数:21页
下载后只包含 1 个 DOCX 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

数据仓库商业智能相关面试题带答案.docx

上传人:likuilian1 2022/3/17 文件大小:29 KB

下载得到文件列表

数据仓库商业智能相关面试题带答案.docx

相关文档

文档介绍

文档介绍:(特征)?
面向主题的,集成的,相对稳定的,反映历史变化的。

数据源
是数据仓库系统的基础,是整个系统的数据源泉。通常包括企业内部信息和外部现的,ODS中的数据是基于分析主题进行组织,而不是基于业务系统的功能进行组织。ODS只是存储了当前的数据且数据是“挥发”性的,因此其数据的刷新是很快,过期的数据将要被挥发掉。因此ODS的存储量取决于业务接口数据的抽取与刷新频率,取决于企业的服务客户的数量。
从ODS的作用和实现来说,ODS将各个孤立的业务系统的运营数据集成起来,现成全企业的统一数据视图,同时可实现ODS的数据共享。

数据仓库领域里,有一种构建数据仓库的架构,叫CorporateInformationFactory中文一般翻译为“企业信息工厂”。企业信息工厂的创始人是数据仓库之父Inmono
企业信息工厂主要包括集成转换层(I&T)、操作数据存储(ODS)、数据仓库(EDW)、数据集市(DM)、探索仓库(EW)等部件。这些部件有机的结合在一起,为企业提供信息服务。
集成转换层的目的是将来自操作型源系统的数据集成转换到数据仓库中,它通常由一
组程序组成,而其它部件如数据仓库和数据集市等则主要由数据组成。当业务数据来源多,
业务复杂时,集成转换层会建立一些临时表,为数据处理提供方便。这时,集成转换层包括程序和数据,也称数据准备区(DataStagingArea。通常中等规模及以上的数据仓库系统都会建立数据准备区。
操作数据存储(ODS)是建立在数据准备区和数据仓库之间的一个部件。用来满足企业集成的、综合的操作型处理需要。例如,出尽可能实时的集成的操作报表等需求。
一般,也称操作数据存储是用来满足企业战术决策的需要。操作数据存储是个可选的部件。
数据仓库是企业信息工厂的核心部件,用来保存整个企业的数据。一般,也称数据仓库是用来满足企业战略决策的需要。数据仓库的数据来自数据准备区和操作数据存储。
数据集市是为了满足企业特定部门的分析需求而专门建立的数据的集合。数据集市的数据来源是数据仓库。企业信息工厂中的数据集市一般来说是非规范化的、定制的和汇总的。而多维体系架构中的数据集市分为两种,分别是原子数据集市和聚集数据集市。一般来说,企业信息工厂中的数据集市相当于多维体系架构中的聚集数据集市。

数据集市中的数据具有数据仓库中数据的特点,只不过数据集市专为某一部门或某个特定商业需求定制,而不是根据数据容量命名。
数据集市面向部门、业务单元或特定应用,因而规模较小,便于快速实现,且成本较低,短期内即可获得明显效果。数据集市的应用不仅满足了部门的数据处理需求,而且作为数据仓库的子集有助于构建完整的企业级数据仓库。
,元数据管理,元数据的作用用?
数据仓库的元数据是关于数据仓库中数据的数据。它的作用类似于数据库管理系统的数据字典,保存了逻辑数据结构、文件、地址和索引等信息。广义上讲,在数据仓库中,元数据描述了数据仓库内数据的结构和建立方法的数据。
元数据是数据仓库管理系统的重要组成部分,元数据管理器是企业级数据仓库中的关键组件,贯穿数据仓库构建的整个过程,直接影响着数据仓库的构建、使用和维护。
构建数据仓库的主要步骤之一是ETL。这时元数据将发挥重要的作用,它定义了源数据系统到数据仓库的映射、数据转换的规则、数据仓库的逻辑结构、数据更新的规则、数据导入历史记录以及装载周期等相关内容。数据抽取和转换的专家以及数据仓库管理员正是通过元数据高效地构建数据仓库。
用户在使用数据仓库时,通过元数据访问数据,明确数据项的含义以及定制报表。
数据仓库的规模及其复杂性离不开正确的元数据管理,包括增加或移除外部数据源,改变数据活洗方法,控制出错的查询以及安排备份等。
元数据可分为技术元数据和业务元数据。技术元数据为开发和管理数据仓库的IT人员使用,它描述了与数据仓库开发、管理和维护相关的数据,包括数据源信息、数据转换描述、数据仓库模型、数据活洗与更新规则、数据映射和访问权限等。而业务元数据为管理层和业务分析人员服务,从业务角度描述数据,包括商务术语、数据仓库中有什么数据、数据的位置和数据的可用性等,帮助业务人员更好地理解数据仓库中哪些数据是可用的以及如何使用。
在数据仓库中,元数据的主要作用如下。
描述哪些数据在数据仓库中,帮助决策分析者对数据仓库的内容定位。
定义数据进入数据仓库的方式,作为数据汇总、映射和活洗的指南。
记录业务事件发生而随之进行的数据抽取工作时间安排。
记录并检测系统数据一致性的要求和执行情况。
评估数据质量。