1 / 12
文档名称:

数据挖掘复习题.doc

格式:doc   大小:91KB   页数:12页
下载后只包含 1 个 DOC 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

数据挖掘复习题.doc

上传人:2286107238 2019/1/18 文件大小:91 KB

下载得到文件列表

数据挖掘复习题.doc

文档介绍

文档介绍:,买啤酒的人很大概率也会购买尿布,这种属于数据挖掘的哪类问题?(A)?(A)(a)警察抓小偷,描述警察抓的人中有多少个是小偷的标准。(b)描述有多少比例的小偷给警察抓了的标准。,,,,、变换、维度规约、数值规约是在以下哪个步骤的任务?(C),可以使用哪种技术促使带同类标签的数据与带其他标签的数据相分离?(B)?(A),对数据进行探索属于数据挖掘的哪一类任务?(A);把多维空间划分成组等问题属于数据挖掘的哪一类任务?(B),通过这个模型根据已知的变量值来预测其他某个变量值属于数据挖掘的哪一类任务?(C),属于数据挖掘哪一类任务?(A)?(D):5,10,11,13,15,35,50,55,72,92,204,215使用如下每种方法将它们划分成四个箱。等频(等深)划分时,15在第几个箱子内?(B),等宽划分时(宽度为50),15又在哪个箱子里?(A):(D),属于定量的属性类型是:(C):(C):(D):(B){1、2、3、4、5、90},其截断均值(p=20%)是(C)?(A),投掷均匀正六面体骰子的熵是:(B)。利用最大最小规范化的方法将属性的值映射到0至1的范围内。e的73600元将被转化为:(D)。数据元组中age的值如下(按递增序):13,15,16,16,19,20,20,21,22,22,25,25,25,30,33,33,35,35,36,40,45,46,52,70,问题:使用按箱平均值平滑方法对上述数据进行平滑,箱的深度为3。第二个箱子值为:(A){12243324556826},其四分位数极差是:(A):一年级200人,二年级160人,三年级130人,四年级110人。则年级属性的众数是:(A):(B),当合适的样本容量很难确定时,可以使用的抽样方法是:(D),下面的描述不正确的是(C);;;,:(D),数据仓库,数据集市和应用程序等结构相关的信息;;