1 / 11
文档名称:

2019年公需培训数据挖掘答案.docx

格式:docx   大小:25KB   页数:11页
下载后只包含 1 个 DOCX 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

文档介绍:数据挖掘
1、(单选,4分)
以下哪项不属于知识发现的过程?( )
A、
数据清理
B、
数据挖掘
C、
知识可视化表达
D、
数据测试


答案:
2、(单选,4分)
以下哪些不属于数据挖掘的内容?( )
数据挖掘
1、(单选,4分)
以下哪项不属于知识发现的过程?( )
A、
数据清理
B、
数据挖掘
C、
知识可视化表达
D、
数据测试


答案:
2、(单选,4分)
以下哪些不属于数据挖掘的内容?( )
A、
分类
B、
聚类
C、
离群点检测
D、
递归分析


答案:
3、(单选,4 分) 以下哪个不是常见的属性类型? ( )

A、
A.标称属性
B、
数值属性
C、
高维属性
D、
序数属性









答案:
4、(单选,4分) 以下哪个度量属于数据散度的描述? ( )
A、均值
B、 中位数
C、 标准差
D、 众数
答案:C
5、(单选,4 分) 以下哪个度量不属于数据中心趋势度描述?( D )
A、 A.均值
B、 中位数
C、 众数
D、 四分位数
答案: D
6、(单选,4分) 对数据进行数据清理、集成、变换、规约是数据挖掘哪个步骤的任务?( )
A、 频繁模式挖掘
B、 分类和预测
C、 数据预处理
D、 噪声检测
答案: C
7、(单选,4分)
聚类分析是数据挖掘的一种重要技术,以下哪个算法不属于聚类算法?( )
A、 K—Means
B、 DBSCAN
C、SVM

D、EM 答案:C
8、(单选,4 分)
建立一个模型,通过这个模型根据已知的变量值来预测其他某个变量值属于数据 挖掘的哪一类任务?( )
A、
根据内容检索
B、
建模描述
C、
预测建模
D、
寻找模式和规则


答案:
9、(单选,4分)
当不知道数据所带标签时. 可以使用哪种技术促使带同类标签的数据与带其他 标签的数据相分离?( )
A、
分类
B、
聚类
C、
关联分析
D、
隐马尔可夫链


答案:
10、(单选,4分)
在构造决策树时,以下哪种不是选择属性的度量的方法? ( )
A、
信息增益
B、
信息增益率
C、
基尼指数
D、
距离


答案: D
11、(单选,4分) 知识发现流程最核心的步骤是什么? ( )
A、 数据挖掘
B、 数据预处理
C、模式评估
「D、知识表示
答案:A
12、(单选,4 分) 将原始数据进行集成、变换、维度规约、数值规约是在以下哪个步骤的任务?()
A、 频繁模式挖掘
B、 分类和预测
C、 数据预处理
D、数据流挖掘
答案: C 13、(单选,4 分) 以下哪个度量属于数据中心性的描述? ( )
A、均值
「B、极差
C、 众数
D、 标准差
答案: A
14、(单选,4分)
类分析是数据挖掘的一种重要技术,以下哪个算法不属于聚类算法?( )
A、 K—Means
B、 DBSCAN
C、
KNN
D、
EM


答案:
15、(单选,4 分)
某超市研究销售纪录数据后发现,买啤酒的人很大概率也会购买尿布,这种属于 数据挖掘的哪类问题? ( )
A、
关联规则发现
B、
聚类
C、
分类
D、
自然语言处理

答案:
16、(单选,4 分) 以下哪些算法是分类算法?( )
A、 DBSCAN
B、C4.5
C、 K—Mean
D、EM 答案:B
17、(单选,4 分)
K—means 算法的缺点不包括?( )
A、K必须是事先给定的
B、选择初始聚类中心
C、对于“噪声”和孤立点数据是敏感的
D、可伸缩、高效
答案:D
18、(单选,4 分) 机器学习中,下面哪些方法不可以避免分类中的过拟合问题?( )

A、
增加样本数量
B、
增加模型复杂度
C、
去除噪声
D、
正则化









答案:
19、(单选,4 分)
面那个不属于知识发现过程。( )
A、
数据清理与集成
B、
数据统计
C、
数据挖掘
D、
模式评估和知识表示


答案:
20、(单选,4分)
在构造决策树时,以下那个不属于选择属性的度量? ( )
A、
信息增益
B、
信息增益率
C、
基尼指数
D、
信息熵

答案: 21、(单选,4 分)
关于频繁模式,下面哪一个陈述是正确的? ( )

A、
K 项集频繁则 K-1 项则必定不频繁
B、

分享好友

预览全文

2019年公需培训数据挖掘答案.docx

上传人:niupai21 2022/5/20 文件大小:25 KB

下载得到文件列表

2019年公需培训数据挖掘答案.docx

相关文档