1 / 9
文档名称:

数据挖掘实验报告.docx

格式:docx   大小:255KB   页数:9页
下载后只包含 1 个 DOCX 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

数据挖掘实验报告.docx

上传人:kang19821012 2018/9/19 文件大小:255 KB

下载得到文件列表

数据挖掘实验报告.docx

相关文档

文档介绍

文档介绍:机器学****与数据挖掘
学生姓名:
学号:6008
专业:计算机科学与技术
班级:计算机2084班
1实验内容
(1)
(2)属性个数对该关系的影响
2实验思路
。对于第一个问题来说,影响算法精度的因素很多,数据集大小只是其中的一个。在研究训练集对算法精度影响实验中要求固定其他影响因素,,对训练集进行多次不同随机采样,采用同样的测试集测试模型精度并记录每次测试的结果,最后分析比较得出结论。在研究测试集对算法精度影响时,采用同样的训练集对测试集进行不同的抽样得到不同的测试集,然后进行测试并记录结果,对结果进行归纳总结得出结论。对于第二个问题,使用同一个数据集,采用带筛选器的分类器,对处理后的数据进行10重交叉验证,记录所得精度,修改筛选器的抽样比率,得到不同的数据集,重复实验,比较得最后的结论。
此次试验要求采用多组数据进行相同的测试,最后分析归纳得出结论。
3实验过程
对实验数据进行预处理,将数据中的数值型数据转变为离散型数据。。选中Choose中的Discretize得到图2的界面进行参数设置attributeIndices设置的是想要离散化属性的标号,bins设置将属性离散为几个离散值。这里设置的是将第1,5,10个属性分别离散到三个数据段内。点击确定返回主页面并点击Apply完成离散化。
图1


,实例个数1100,属性个数13为例进行实验过程:
(1),,对原训练数据集进行无监督的随机抽样,选中ReservoirSample进行参数设置得到图2,将sampleSize属性设置为100,点击确定返回主页面并点击Apply即抽取100个数据作为新的训练数据集。
图2
(2) test set选项,点击set打开测试集进行测试如图3
图3
(3)%。这个结果相对来说比较低。
图4
(4),修改抽样个数,重复试验得到如下数据:
训练集抽样数
100
200
300
400
500
600
700
800
900
1100
模型
精度%










(5)对其他数据进行同样的实验得到下列数据:
,实例个数,属性个数17
训练集抽

最近更新

2024年玻璃布增强塑料项目发展计划 61页

风娃娃大班市公开课获奖教案省名师优质课赛课.. 4页

2024年白炽灯:普通照明白炽灯合作协议书 55页

采薇市公开课获奖教案省名师优质课赛课一等奖.. 5页

心理治疗在强迫症患者中的应用及效果分析 31页

心室颤动的急诊处理方法 27页

论诗赵翼市公开课获奖教案省名师优质课赛课一.. 5页

2024年LOGO设计项目合作计划书 71页

2024年CT模拟定位机项目发展计划 54页

节奏音乐市公开课获奖教案省名师优质课赛课一.. 5页

老王市公开课获奖教案省名师优质课赛课一等奖.. 6页

弘扬航天精神助推中国航天的世界领先地位 25页

麦田主题农场项目商业计划书 6页

引入美容院合作以优化口腔医院渠道的利润结构.. 27页

绘本中班市公开课获奖教案省名师优质课赛课一.. 6页

骑士换电项目商业计划书 6页

科学赏荷去市公开课获奖教案省名师优质课赛课.. 5页

离合词的市公开课获奖教案省名师优质课赛课一.. 6页

礼仪市公开课获奖教案省名师优质课赛课一等奖.. 3页

零食计划项目商业计划书互联网 8页

的士高音乐市公开课获奖教案省名师优质课赛课.. 4页

幼儿学习与发展的移动科技应用 25页

玫瑰渐变涂色市公开课获奖教案省名师优质课赛.. 5页

狐狸折纸市公开课获奖教案省名师优质课赛课一.. 5页

金融工程师的职业规划与设计 6页

滚色中班市公开课获奖教案省名师优质课赛课一.. 5页

布托啡诺对神经性疼痛患者的生活质量改善效果.. 28页

布托啡诺在足部手术后疼痛管理中的临床应用研.. 27页

布托啡诺在癌症镇痛中的应用研究进展 30页

风机及箱变基础等施工方案 28页