1 / 8
文档名称:

数据挖掘考试题.docx

格式:docx   大小:33KB   页数:8页
下载后只包含 1 个 DOCX 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

数据挖掘考试题.docx

上传人:changjinlai 2021/8/4 文件大小:33 KB

下载得到文件列表

数据挖掘考试题.docx

文档介绍

文档介绍:数据挖掘考试题
一. 选择题
. 当不知道数据所带标签时,可以使用哪种技术促使带同类标签的数据与带其他标签的数
据相分离? ( )

. ( )将两个簇的邻近度定义为不同簇的所有点对邻近度的平均值,它是一种凝聚层次聚类
技术。
(单链) (全链)
.数据挖掘的经典案例“啤酒与尿布试验”最主要是应用了 ( )数据挖掘方法。
A 分类 B 预测 C 关联规则分析 D 聚类
.关于 K 均值和 DBSCAN 的比较,以下说法不正确的是 ( )
均值丢弃被它识别为噪声的对象,而 DBSCAN 一般聚类所有对象。
均值使用簇的基于原型的概念, DBSCAN 使用基于密度的概念。
均值很难处理非球形的簇和不同大小的簇, DBSCAN 可以处理不同大小和不同形状的簇
均值可以发现不是明显分离的簇,即便簇有重叠也可以发现,但是 DBSCAN 会合并有
重叠的簇
Ward’ s Method 说法错误的是: ( )


,两个簇的邻近度定义为两个簇合并时导致的平方误差
, Ward方法与组平均非常相似
.下列关于层次聚类存在的问题说法正确的是: ( )
A. 具有全局优化目标函数
Average 擅长处理球状的簇

对噪声点和离群点很敏感
.下列关于凝聚层次聚类的说法中,说法错误的事: ( )
,该操作就不能撤销
.算法的终止条件是仅剩下一个簇
m2

8规则{牛奶,尿布}一{啤酒}的支持度和置信度分别为:()
TID
项 集
1
{面包,牛奶}
2
{面包,尿布,啤酒,鸡蛋}
3
{牛奶,尿布,啤酒,可乐}
4
{回包,牛奶,尿布,啤酒}
5
{回包,牛奶,尿布,可乐}
, , , ,
.下列()是属于分裂层次聚类的方法。
Average
.对下图数据进行凝聚聚类操作, 簇间相似度使用 MAX计算,第二步是哪两个簇合并:()
I2 I3 I4 I5
11
I2
I3
I4
I5
100 0,90 0J0 0,65
1,00 070 0,60 0,50
070 too 0,30


{3}和{l,2}合并 B.{3}和{4,5}合并 C.{2,3}和{4,5}合并
D. {2,3}和{4,5}形成簇和{3}合并
填空题:
.属性包括的四种类型:、、、。
. 是两个簇的邻近度定义为不同簇的所有点对邻近度的平均值。
.基本凝聚层次聚类算法空间复杂度 ,时间复杂度,如果某个簇到其他所 有簇的距离存放在一个有