1 / 117
文档名称:

CPDA题库.docx

格式:docx   大小:2,343KB   页数:117页
下载后只包含 1 个 DOCX 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

CPDA题库.docx

上传人:文艺人生 2024/4/30 文件大小:2.29 MB

下载得到文件列表

CPDA题库.docx

相关文档

文档介绍

文档介绍:该【CPDA题库 】是由【文艺人生】上传分享,文档一共【117】页,该文档可以免费在线阅读,需要了解更多关于【CPDA题库 】的内容,可以使用淘豆网的站内搜索功能,选择自己适合的文档,以下文字是截取该文章内的部分文字,如需要获得完整电子版,请下载此文档到您的设备,方便您编辑和打印。CPDA题库1“大数据”是指规模超过1000TB的数据集。×2概率为0的事件是不可能事件,概率为1的事件是必然事件。×3将总体中的各单位按某一标志排列再依固定间隔抽选调查单位的抽样方式为等距抽样√4统计图中的散点图主要用来观察变量之间的相关关系。√5抽样误差是指在调查过程中由于观察、测量等差错所引起的误差。×-means聚类分析要求输入的数据必须是数值型数据。√7如果事件A,B互斥,且P(A)>0,P(B)>0,则A,B独立。×8?SQL中删除表的命令是“DELETETABLE”。×9聚类分析中,各变量的取值在数量级上不能有过大的差异。√10如果某产品的生产和销售正处于市场成长期,其营销重点应该是延长产品寿命。×11需求定价法的核心思想是力求在需求高涨时收取较低价格,而当需求低落时则收取较高价格。×12使用索引可以快速访问数据库中的数据,所4假设检验中显著性水平是(?B)A、推断时犯取伪错误的概率B、推断时取伪弃真的概率C、正确推断的概率D、是推断的可信度5矩估计的基本原理是(A?)A、用样本矩估计总体矩B、使得似然函数达到最大C、使得似然函数达到最小D、小概率事件在一次试验中是不可能发生的6SQL查询语句中HAVING子句的作用是(?C)A、指出分组查询的范围B、指出分组查询的值C、指出分组查询的条件D、指出分组查询的内容7以下哪项关于决策树的说法是错误的(C?)A、冗余属性不会对决策树的准确率造成不利的影响B、子树可能在决策树中重复多次C、决策树算法对于噪声的干扰非常敏感D、寻找最佳决策树是NP完全问题8以下哪种方法不属于于监督学****模型(C)A、决策树B、线性回归C、关联分析D、判别分析9考虑下面的频繁3-项集的集合:{1,2,3},{1,2,4},{1,3,4},{1,3,5},{2,3,4},{2,3,5},{3,4,5}假定数据集中只有5个项,若采用合并策略,则由候选产生过程得到4-项集不包含(C)A、1,2,3,4B、1,2,3,5C、1,2,4,5D、1,3,4,510下列不属于原始数据来源的是(?C?)A、行政记录B、统计调查C、统计年鉴D、实验11下列不属于分类算法的是(?D)A、、逻辑回归C、KNN算法D、TF-TDF算法12相关分析与回归分析的一个重要区别是(A?)A、前者研究变量之间关系的密切程度,后者研究变量间的变动关系,并用方程式表示B、前者研究变量之间的变动关系,后者研究变量间关系的密切程度C、两者都研究变量间的变动关系D、两者都不研究变量间的变动关系13数据仓库是随着时间变化的,下面的描述不正确的是(C)A、数据仓库随时间的变化不断增加新的数据内容B、捕捉到的新数据会覆盖原来的快照C、数据仓库随时间变化不断删去旧的数据内容D、数据仓库中包含大量的综合数据,这些综合数据会随着时间的变化不断地进行重新综合14资金的时间价值是(B)A、同一资金在同一时点上价值量的差额B、同一资金在不同时点上价值量的差额C、不同资金在同一时点上价值量的差额D、不同资金在不同时点上价值量的差额15描述一组对称(或正态)分布数据的离散程度时,最适宜选择的指标是(B)A、极差B、标准差C、均值D、变异系数16下列有关Apriori算法的说法中不正确的是(C)A、Apriori算法是关联分析中最常用的算法之一。B、应用Apriori算法时,需要先设定模型的最小支持度、最小置信度等阈值。C、应用Apriori算法时,输入的数据可以是连续型数据也可以是离散型数据。D、Apriori算法扫描数据库的次数依赖于最大频繁项集中项的数量。17当置信水平一定时,置信区间的宽度(A)A、随着样本量的增大而减小B、随着样本量的增大而增大C、与样本量的大小无关D、先随着样本量的增大而减小,到一定程度后会随着样本量的增大而增大。18一种商品价格变动与由此引起另外一种商品需求量相对变动的比率称为(C)A、需求价格弹性B、供给价格弹性C、需求交叉弹性D、供给交叉弹性19分类器效果检验中的准确率是指(C)A、预测正确的数据在总数据中的比例B、预测为正的数据在总数据中的比例C、预测为正的数据中实际为正的数据所占比例D、实际为正的数据中被预测为正的数据所占比例20给出下列结论:(1)在回归分析中,可用指数系数R方的值判断模型的拟合效果,R方越大,模型的拟合效果越好;(2)在回归分析中,可用残差平方和判断模型的拟合效果,残差平方和越大,模型的拟合效果越好;(3)在回归分析中,可用相关系数r的值判断模型的拟合效果,r越小,模型的拟合效果越好;(4)在回归分析中,可用残差图判断模型的拟合效果,残差点比较均匀地落在水平的带状区域中,,,正确的有(?A)、1B、2C、3D、421维度规约是在以下哪个步骤的任务?(C)A、频繁模式挖掘B、降维C、数据预处理D、数据流挖掘e的最大最小值分别是12000元和98000元。利用最大-最小规范化的方法将属性的值映射到0至1的范围内。e的73600元将被转化为(D)A、、、、。数据元组中age的值如下(按递增序):13,15,16,16,19,20,20,21,22,22,25,25,25,30,33,33,35,35,36,40,45,46,52,70,?问题:使用按箱平均值平滑方法对上述数据进行平滑,箱的深度为3。第二个箱子值为(?B)A、、、、以上都不对24EXCEL中,求标准差的函数是(?D)A、AVERAGEB、MEDIANC、MODED、STDEV25人们购买制冷用空调主要是为了在夏天获得凉爽空气,这属于空调产品整体概念中的(C)A、有形产品B、直接产品C、核心产品D、主要产品26贝叶斯决策是根据(D?)进行决策的一种方法。A、极大似然概率B、先验概率C、边际概率D、后验概率27某人欲为子女筹措250000元的留学经费,预计在8年内的每年年初在银行存入一笔款项,如银行存款年利率为8%,每年应存入金额为(D?)A、、、、(?A)A、平滑常数B、指数平滑数初始值C、跨越期D、季节指数29某牙膏厂原来生产两面针药物牙膏,现在又增加牙刷生产,这属于(B?)A、同心多元化B、水平多元化C、集团多元化D、相关多元化30净现值、内部收益率、获利指数指标之间的数量关系是(?B)A、当NPV>0时,IRR>i,PI<1B、当NPV>0时,IRR>i,PI>1C、当NPV<0时,IRR>i,PI<1D、当NPV<0时,IRR>i,PI>11以下关于皮尔森相关分析叙述正确的是(?AB?)A、两变量独立,两者的皮尔森相关系数必然等于0B、两变量皮尔森相关系数不等于0,两者必然不独立