1 / 11
文档名称:

数据挖掘考试题.doc

格式:doc   大小:93KB   页数:11页
下载后只包含 1 个 DOC 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

数据挖掘考试题.doc

上传人:beny00001 2020/4/14 文件大小:93 KB

下载得到文件列表

数据挖掘考试题.doc

文档介绍

文档介绍:,可以使用哪种技术促使带同类标签的数据与带其他标签的数据相分离?().()将两个簇的邻近度定义为不同簇的所有点对邻近度的平均值,它是一种凝聚层次聚类技术。(单链)(全链)“啤酒与尿布试验”最主要是应用了()数据挖掘方法。,以下说法不正确的是(),而DBSCAN一般聚类所有对象。,DBSCAN使用基于密度的概念。,,即便簇有重叠也可以发现,’sMethod说法错误的是:(),,Ward方法与组平均非常相似下列关于层次聚类存在的问题说法正确的是:(),说法错误的事:(),{牛奶,尿布}→{啤酒}的支持度和置信度分别为:()TID项集12345{面包,牛奶}{面包,尿布,啤酒,鸡蛋}{牛奶,尿布,啤酒,可乐}{面包,牛奶,尿布,啤酒}{面包,牛奶,尿布,可乐},,,,()是属于分裂层次聚类的方法。 ,簇间相似度使用MAX计算,第二步是哪两个簇合并:(){3}和{l,2}合并B.{3}和{4,5}合并C.{2,3}和{4,5}合并D.{2,3}和{4,5}形成簇和{3}合并填空题:属性包括的四种类型:、、、。是两个簇的邻近度定义为不同簇的所有点对邻近度的平均值。,时间复杂度,如果某个簇到其他所有簇的距离存放在一个有序表或堆中,层次聚类所需要的时间复杂度将为。,定义簇间的相似度的方法有(写出四个):、、、。。两种层次聚类的基本方法:、。。。,可能使破裂,并且偏好。,但对和很敏感。。(有监督、无监督),每一步合并两个最接近的簇,这是一种分裂的层次聚类方法。()数据挖掘的目标不在于数据采集策略,而在于对已经存在的数据进行模式的发掘。()在聚类分析当中,簇内的相似性越大,簇间的差别越大,聚类的效果就越差。()当两个点之间的邻近度取它们之间距离的平方时,Ward方法与组平均非常相似。()DBSCAN是相对抗噪声的,并且能够处理任意形状和大小的簇。()属性的性质不必与用来度量他的值的性质相同。()全链对噪声点和离群点很敏感。()对于非对称的属性,只有非零值才是重要的。()K均值可以很好的处理不同密度的数据。()单链技术擅长处理椭圆形状的簇。()?它用哪两种图表示? ?两种方法的定义?分别写出Min、Max和组平均的优缺点?写出基本凝聚层次聚类的算法?由下图已给出的距离矩阵,将Max用于6个点样本数据集,画出层次聚类的树状图?+,可以使用哪种技术促使带同类标签的数据与带其他标签的数据相分离?(B).(C)将两个簇的邻近度定义为不同簇的所有点对邻近度的平均值,它是一种凝聚层次聚类技术。(单链)(全链)“啤酒

最近更新

缝合泡沫夹芯复合材料低速冲击的多尺度数值方.. 4页

给煤量操作失误造成CFB锅炉回料阀堵塞的研究 3页

纳豆菌产糖苷酶的发酵工艺优化 3页

精益生产在客车底盘制造中的实施与应用 3页

简易物料提升系统在集中煤仓维修中的应用 3页

立式屏蔽电机半速涡动异常振动试验分析 4页

空冷机组凝结水精处理树脂耐温实验研究 4页

移动互联网医院云平台的建设及设计研究 3页

碳酸盐储层岩石物理及波场特征分析 3页

矿石质量智能控制系统研究与应用 3页

茶树常见害虫识别 25页

艺术功能与艺术教育 34页

2025年(2025)完整版加盟餐饮合同范本 24页

2025年龙年电子公司适合好名500个 7页

肺栓塞影像表现 42页

2025年属龙几月出生旺父母 6页

2025年高考文综的答题技巧和复习方法 4页

2025年高考历史一轮复习方法 5页

2025年高考励志为主题作文 42页

2025年属羊给女孩起名字大全 3页

2025年属狗缺木杨姓男孩名字推荐 7页

2025年高二的作文800字 14页

2025年属兔的今年多大年龄 6页

2025年高中语文作文万能人物事例 7页

2025年高中生写节约水资源优秀作文00字 6页

电动自行车充电桩智慧管理系统平台建设方案 6页

黑龙江生物竞赛试题及答案 4页

食品安全自查、从业人员健康管理、进货查验记.. 9页

人教版五年级数学下册第一二单元测试卷 5页

五年级软笔书法教案 21页