文档介绍:--------------------------校验:_____________-----------------------日期:_____________《数据仓库与数据挖掘》复习题2014-2015-1《数据仓库与数据挖掘》期末考试题型单项选择题(每小题2分,共20分)填空题(每空1分,共20分)简答题(每题6分,共30分)析题与计算题(共30分)请同学们在考试时不要将复习资料带入考场!!!,买啤酒的人很大概率也会购买尿布,这种属于数据挖掘的哪类问题?(A)?(A)(a)警察抓小偷,描述警察抓的人中有多少个是小偷的标准。(b)描述有多少比例的小偷给警察抓了的标准。,,,,、变换、维度规约、数值规约是在以下哪个步骤的任务?(C),可以使用哪种技术促使带同类标签的数据与带其他标签的数据相分离?(B)?(A),对数据进行探索属于数据挖掘的哪一类任务?(A);把多维空间划分成组等问题属于数据挖掘的哪一类任务?(B),通过这个模型根据已知的变量值来预测其他某个变量值属于数据挖掘的哪一类任务?(C),属于数据挖掘哪一类任务?(A)?(D):5,10,11,13,15,35,50,55,72,92,204,215使用如下每种方法将它们划分成四个箱。等频(等深)划分时,15在第几个箱子内?(B),等宽划分时(宽度为50),15又在哪个箱子里?(A):(D),属于定量的属性类型是:(C):(C):(D):(B){1、2、3、4、5、90},其截断均值(p=20%)是(C)?(A),投掷均匀正六面体骰子的熵是:(B)。利用最大最小规范化的方法将属性的值映射到0至1的范围内。e的73600元将被转化为:(D)。数据元组中age的值如下(按递增序):13,15,16,16,19,20,20,21,22,22,25,25,25,30,33,33,35,35,36,40,45,46,52,70,问题:使用按箱平均值平滑方法对上述数据进行平滑,箱的深度为3。第二个箱子值为:(A){12243324556826},其四分位数极差是:(A):一年级200人,二年级160人,三年级130人,四年级110人。则年级属性的众数是:(A):(B),当合适的样本容量很难确定时,可以使用的抽样方法是:(D),下面的描述不正确的是(C);;;