1 / 10
文档名称:

数据挖掘试题.pdf

格式:pdf   大小:872KB   页数:10页
下载后只包含 1 个 PDF 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

数据挖掘试题.pdf

上传人:青山代下 2024/5/21 文件大小:872 KB

下载得到文件列表

数据挖掘试题.pdf

相关文档

文档介绍

文档介绍:该【数据挖掘试题 】是由【青山代下】上传分享,文档一共【10】页,该文档可以免费在线阅读,需要了解更多关于【数据挖掘试题 】的内容,可以使用淘豆网的站内搜索功能,选择自己适合的文档,以下文字是截取该文章内的部分文字,如需要获得完整电子版,请下载此文档到您的设备,方便您编辑和打印。,买啤酒的人很大概率也会购买尿布,这种属于数据挖掘的哪类问题?(A)、变换、维度规约、数值规约是在以下哪个步骤的任务?(C),可以使用哪种技术促使带同类标签的数据与带其他标签的数据相分离?(B),对数据进行探索属于数据挖掘的哪一类任务?(A)?(D):5,10,11,13,15,35,50,55,72,92,204,215使用如下每种方法将它们划分成四个箱。等频(等深)划分时,15在第几个箱子内?(B),等宽划分时(宽度为50),15又在哪个箱子里?(A):(C):(D):(B)。利用最大最小规范化的方法将属性的值映射到0至1的范围内。对属e的73600元将被转化为:(D)。数据元组中age的值如下(按递增序):13,15,16,16,19,20,20,21,22,22,25,25,25,30,33,33,35,35,36,40,45,46,52,70,问题:使用按箱平均值平滑方法对上述数据进平滑,箱的深度为行3。第二个箱子值为:(A),下面的描述不正确的是(C);;;,:(D),数据仓库,数据集市和应用程序等结构相关的信息;;;,:(C);,粒度就越小,级别也就越高;,粒度也就越大,级别也就越高;:(D);;;,下面正确的是:(D)(1)快速性(2)可分析性(3)多维性(4)信息性(5)共享性A.(1)(2)(3)B.(2)(3)(4)C.(1)(2)(3)(4)D.(1)(2)(3)(4)(5),不正确的是:(C),,,但其最终数据来源与OLTP一样均来自底层的数据库系统,,下列不正确的是:(A),,={1,2,3}是频繁项集,则可由X产生__(C)__个关联规则。A、4B、5C、6D、(B)__图。A、无向无环B、有向无环C、有向有环D、、频繁闭项集、最大频繁项集之间的关系是:(C)A、频繁项集频繁闭项集=最大频繁项集B、频繁项集=频繁闭项集最大频繁项集C、频繁项集频繁闭项集最大频繁项集D、频繁项集=频繁闭项集=,这样的任务称为(B)A、频繁子集挖掘B、频繁子图挖掘C、频繁数据项挖掘D、,A,DBSCANB,,K-MeanD,EM(B),A,根结点(rootnode)B,内部结点(internalnode)C,外部结点(externalnode)D,叶结点(leafnode)(C)(C),依据规则质量的某种度量对规则排序,保证每一个测试记录都是由覆盖它的“最好的”规格来分类,这种方案称为(B)。,R中都存在一条规则加以覆盖,则称规则集R中的规则为(B)A,无序规则B,穷举规则C,互斥规则D,,则称规则集是(D)A,无序规则B,穷举规则C,互斥规则D,(ANN)的描述错误的有(A)A,神经网络对训练数据中的噪声非常鲁棒B,可以处理冗余特征C,训练ANN是一个很耗时的过程D,至少含有一个隐藏层的多层神经网络二、:(AB)、方便并且有价值地总结了数据的某一特征的表示,这个过程包括了以下哪些步骤?(ABCD)。:(ABCD)?(AD),元组在某些属性上缺少值是常有的。描述处理该问题的各种方法有:(ABCDE),存在的问题有:(ABCDE),哪些是数据仓库的基本特征:(ACD),你认为正确的有(BCDE)。,支持联机事务处理(OLTP),:(ABCD)?(BCD)。在以下的购物篮中产生支持度不小于3的候选3-项集,在候选2-项集中需要剪枝的是(BD)ID项集1面包、牛奶2面包、尿布、啤酒、鸡蛋3牛奶、尿布、啤酒、可乐4面包、牛奶、尿布、啤酒5面包、牛奶、尿布、可乐A、啤酒、尿布B、啤酒、面包C、面包、尿布D、啤酒、(ABCD)?__影响。A、支持度阀值B、项数(维度)C、事务数D、(AD)__A、其支持度小于阈值B、都是不让人感兴趣的C、包含负模式和负相关模式D、(BBN)有如下哪些特点,A,构造网络费时费力B,对模型的过分问题非常鲁棒C,贝叶斯网络不适合处理不完整的数据D,网络结构确定后,添加变量相当麻烦(AB)三、,从而能更好的完成描述数据、预测数据等任务。(对),而在于对于已经存在的数据进行模式的发掘。(对)。(对),它对整个测量空间的每一点做出描述;模型则对变量变化空间的一个有限区域做出描述。(错),使其符合某种规则以及模式。(错)。(对)。(错)。(错)。(对)。(错)。(对)。(对)、转换成辅助决策信息,是继数据库技术发展之后迅猛发展起来的一种新技术。(对)(错),仓库管理,数据抽取,分析工具等四个部分.(错)。(错),则形如的规则一定也不满足置信度阈值,其中是X的子集。(对)。(错)(clustering)是这样的过程:它找出描述并区分数据类或概念的模型(或函数),以便能够使用模型预测类标记未知的对象类。(错),分类的输出是离散的类别值,而回归的输出是连续数值。(对),待分样本的分类结果取决于各类域中样本的全体。(错)四、?数据仓库与数据库的区别是什么?.简述数据挖掘与传统分析方法的区别?????简述其主要功能????分析其原因及解决办法?,简述其作用及过程?????