1 / 12
文档名称:

数据挖掘实验报告.doc

格式:doc   页数:12页
下载后只包含 1 个 DOC 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

数据挖掘实验报告.doc

上传人:119060444 2016/5/3 文件大小:0 KB

下载得到文件列表

数据挖掘实验报告.doc

文档介绍

文档介绍:智能信息处理课程实验汪辉 20********** 一、实验工具 Weka 简介 Weka 是由新西兰怀卡托大学开发的智能分析系统( Waikato Environment for Knowledge Analysis )。在怀卡托大学以外的地方, Weka 通常按谐音念成 a , 是一种现今仅存活于新西兰岛的,健壮的棕色鸟,非常害羞,好奇心很强,但不会飞。 Weka 是用 Java 写成的,它可以运行于几乎所有的操作平台, 包括 Linux , Windows 等操作系统。 Weka 平台提供一个统一界面,汇集了当今最经典的机器学****算法及数据预处理工具。做为知识获取的完整系统, 包括了数据输入、预处理、知识获取、模式评估等环节,以及对数据及学****结果的可视化操作。并且可以通过对不同的学****方法所得出的结果进行比较,找出解决当前问题的最佳算法。 2005 年 8 月,在第 11届 ACM SIGKDD 国际会议上,怀卡托大学的 Wek a 小组荣获了数据挖掘和知识探索领域的最高服务奖, Weka 系统得到了广泛的认可,被誉为数据挖掘和机器学****历史上的里程碑,是现今最完备的数据挖掘工具之一(已有 11年的发展历史)。 Weka 的每月下载次数已超过万次。二、 Weka 的使用方法 1、是将一种学****方法应用于一个数据集,然后分析其输出,从而更多地了解这些数据(分析数据集的潜在知识)。 2、是使用已学****到的模型对新的实例做出分类预测 3 、是应用几种不同的学****器,再根据它们的性能表现选择其中一种用来做预测。在 Weka 中将学****方法又称作分类器或学****器,用户可在 Weka 互动式界面的菜单中选择一种想要的分类器。许多分类器带有可调节的参数,这些参数可通过属性列表或对象编辑器进行更改。所有学****器的性能都是通过一个共同的评估模块进行衡量。与选择学****器一样,用户也要从菜单中选择能满足或对应该学****器的过滤器(进行数据预处理)。不同的过滤器具有不同的参数。其所处理的数据是一个二维表。三、实验步骤 1、流量数据输入到 weka 平台; 2、 FCBF 或者其它有监督特征选择算法进行特征选择 3、 naive bayes( 朴素贝叶斯)分类四、实验内容 1、无特征选择+贝叶斯; 2、特征选择+贝叶斯; 3、无特征选择+核密度估计贝叶斯; 4、有特征选择+核密度估计贝叶斯; 五、实验代码 1、无特征选择+ 贝叶斯; * Rule: LOCAL dominates NONE; GLOBAL dominates LOCAL. * -> When there isa local credal set, compute with the * local credal set. * -> When there isa global credal set specification, * compute with that (ignore local credal sets). */ public class QBExpectation extends Expectation { ectation( b_n, boolean dpc) { super(b_n, dpc); } protected void initialize_inference() { inference = new QBInference(bn, do_produce_clusters); } protected void do_expectation_from_inference(DiscreteFunction df) { current_function = df; if (((QBInference)inference).is_inference_without_local_neighborhoods) expectation_without_local_neighborhoods(df); else expectation_with_local_neighborhoods(df); } private void expectation_with_local_neighborhoods(DiscreteFunction df) { int i, j, jump = 1; double v, min, max; for (i=1; i<(); i++) jump *= (i).number_values(); min = (0); max = (0); for (i=0; i<