1 / 4
文档名称:

数据仓库与数据挖掘试题.pdf

格式:pdf   大小:399KB   页数:4页
下载后只包含 1 个 PDF 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

数据仓库与数据挖掘试题.pdf

上传人:青山代下 2024/5/13 文件大小:399 KB

下载得到文件列表

数据仓库与数据挖掘试题.pdf

相关文档

文档介绍

文档介绍:该【数据仓库与数据挖掘试题 】是由【青山代下】上传分享,文档一共【4】页,该文档可以免费在线阅读,需要了解更多关于【数据仓库与数据挖掘试题 】的内容,可以使用淘豆网的站内搜索功能,选择自己适合的文档,以下文字是截取该文章内的部分文字,如需要获得完整电子版,请下载此文档到您的设备,方便您编辑和打印。:..判断题(每小题分,计30分,答题时每5个答案写在一起)1.(X)数据库作为数据资源用于管理业务中的信息分析处理。2.(X)数据库的查询不是指对记录级数据的查询,而是指对分析要求的查询。3.(v)关系数据库是二维数据(平面),多维数据库是空间立体数据。4.(V)数据进入数据仓库之前,必须经过加工与集成。?(V)使用的是当前数据;用的是历史数据。6.(X)对数据仓库操作不明确,操作数据量少。7.(X)数据集市实现难度超过数据仓库。?(X)使用的数据经常更新;用的数据不更新,但周期性刷新。9.(V)数据集市可升级到完整的数据仓库。10.(X)数据库中存放的数据基本上是保存当前综合数据。(V)可以应分析人员的要求快速、灵活地进行大数据量的复杂处理。,侧重对分析人员和高层管理人员的决策支持。(V)(V)的事务处理量大,处理内容比较简单但重复率高。14.(V)数据仓库的用户有两类:信息使用者和探索者。15.(X)对数据库的操作比较明确,操作数据量大。16.(V)数据库用于事务处理,数据仓库用于决策分析。17(V).信息使用者以一种可预测的、重发性的方式使用数据仓库平台。(V)一次处理的数据量大;葭次性处理的数据量小。§(V)次操作的数据量不大且多为当前的数据。20.(DW)(V)数据仓库系统由数据仓库、仓库管理和分析工具三部分组成。21.(X)随着业务的变化,数据仓库中的数据会随时更新。22.(X)数据集市的规模比数据仓库更大。23.(V)数据集市具有更详细的、预先存储在数据仓库的数据。24.(V)不同维值的组合及其对应的度量值构成了不同的查询和分析。(X)使用细节性数据,用综合性数据。26.(X)数据集市由企业管理和维护。:..(V)28.(V)数据库已经成为了成熟的信息基础设施。。(X)(V)对的是事务处理操作人员和低层管理人员。二、填空题(每小题1分,计10分)。。。、旋转、钻取等。。。,不同维度组合构成了不同的子立方体。。—数据仓库—的重要步骤,需要花费开发数据仓库70%的工作量。。三、名词解释(每小题5分,计30分)1、数据集市4、元数据2、数据挖掘5、知识发现3、商业智能6、数据仓库1,数据集市()是一种更小、更集中的数据仓库,为公司提供分析商业数据的一条廉价途径。DataMarts是指具有特定应用的数据仓库,主要针对某个应用或者具体部门级的应用,支持4,(metadata)用户获得竞争优势或者找到进入新市场的具体解决方案。元数据定义为关于数据的数据(dataaboutdata,即元数据描述了数据仓库的数据和环境。2,数据挖掘(DM):KDD过程中的一个特定步骤,它用专门算法从数据中抽取知识。3,商业智能以数据仓库为基础,通过联机分析处理和数据挖掘技术帮助企业领导者针对市场变化的环境,做出快速、准确的决策。5,知识发现(KDD):从数据中发现有用知识的整个过程。6,数据仓库是决策支持系统(dss)和联机分析应用数据源的结构化数据环境。数据仓库研究和解决从数据库中获取信息的问题。数据仓库的特征在于面向主题、集成性、稳定性和时:..四、简答题(每小题分,计30分)?数据仓库与数据挖掘都是决策支持新技术。但它们有着完全不同的辅助决策方式。在数据仓库系统的前端的分析工具中,数据挖掘是其中重要工具之一。它可以帮助决策用户挖掘数据仓库的数据中隐含的规律性。?统计学主要是对数量数据(数值)或连续值数据(如年龄、工资等),进行数值计算(如初等运算)的定量分析,得到数量信息。数据挖掘主要对离散数据(如职称、病症等)进行定性分析(覆盖、归纳等),得到规则知识。统计学与数据挖掘是有区别的。但是,它们之间是相互补充的。,供以后查询分析用,而ROLAP是通过动态的生成Sql,去做查询关系型数据库,如果没有做性能优化,数据量很大的时候,性能问题就会显得比较突出了。ROLAP与MOLAP比较ROLAPMOLAP专为OLAP9T设计J沿用现有的关系数据库的技术|响应速度比MOLAPS;现肩关系型数据库已经对OLAP故了很多优化,包括并行存储、并行查性能好、响应速度快询、并行数据管理、基于成本的查询优化、位图索引、SQLBOLAPT展(cube,rollup)等,性能有所提高数据装载速度快数据装载速度慢需要进行预计算,可能导致数据存储空间耗费小,维数没有限制爆炸,维数有限;无法支持维的动态父化:..受操作系统平台中文件大小的寄储数据,没有文件大小限制限制,难以达到TB级(只能1020G)缺乏数据模型和数据访问的标可以通过SQL实现详细数据与概要数据的存储准一支持局性能的决策支持-不支持肩关预计算的读写操作计算-SQLS法完成部分计算?复杂的跨维计算?无法完成多行的计算?多用户的读写操作?无法完成维之间的计算?行级的计算维护困难管理简便4,比较数据挖掘与OLAP勺差异?OLAP的典型应用,通过商业活动变化的查询发现的问题,经过追踪查询找出问题出现的原因,达到辅助决策的作用。数据挖掘任务在于聚类(如神经网络聚类)、分类(如决策树分类)、预测等。5,什么是关于数据仓库映射的元数据?数据仓库的元数据除对数据仓库中数据的描述(数据仓库字典)外,还有以下三类元数据:(1)关于数据源的元数据(2)关于抽取和转换的元数据(3)?(1)快速性:用户对OLAP勺快速反应能力有很高的要求。(2)可分析性:OLAPK统应能处理任何逻辑分析和统计分析。(3)多维性:系统必须提供对数据分析的多维视图和分析。(4)信息性:OLA添统应能及时获得信息,并且管理大容量的信息