1 / 17
文档名称:

机器学习工具weka的使用总结,包括算法选择、属性选择、参数优化.doc

格式:doc   大小:25KB   页数:17页
下载后只包含 1 个 DOC 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

机器学习工具weka的使用总结,包括算法选择、属性选择、参数优化.doc

上传人:wz_198614 2017/6/6 文件大小:25 KB

下载得到文件列表

机器学习工具weka的使用总结,包括算法选择、属性选择、参数优化.doc

文档介绍

文档介绍:------------------------------------------------------------------------------------------------ ——————————————————————————————————————机器学习工具 WEKA 的使用总结, 包括算法选择、属性选择、参数优化一、属性选择: 1 、理论知识: 见以下两篇文章: 数据挖掘中的特征选择算法综述及基于 WEKA 的性能比较_ 陈良龙数据挖掘中约简技术与属性选择的研究_ 刘辉 2、 weka 中的属性选择 评价策略( attribute evaluator ) 总的可分为 filter 和 wrapper 方法,前者注重对单个属性进行评价,后者侧重对特征子集进行评价。 Wrapper 方法有: CfsSubsetEval Filter 方法有: CorrelationAtt ributeEval Wrapper 方法: (1) CfsSubsetEval 根据属性子集中每一个特征的预测能力以及它们之间的关联性进行评估, 单个特征预测能力强且特征子集内的相关性低的子集表现好。 Evaluates the worth ofa subset of attributes by considering the individual predictive ability of each feature along with the degree of redundancy between of features that are highly correlated ------------------------------------------------------------------------------------------------ —————————————————————————————————————— with the class while having low intercorrelation are preferred. For more information see: M. A. Hall (1998). Correlation-based Feature Subset Selection for Machine Learning. Hamilton, New Zealand. (2) WrapperSubsetEval Wrapper 方法中,用后续的学习算法嵌入到特征选择过程中,通过测试特征子集在此算法上的预测性能来决定其优劣, 而极少关注特征子集中每个特征的预测性能。因此, 并不要求最优特征子集中的每个特征都是最优的。 Evaluates attribute sets by using a learning scheme. Cross validation is used to estimate the accuracy of the learning scheme for a set of attributes. For more information see: Ron Kohavi, e H. John (1997). Wrappers for feature subset Intelligence. 97(1-2):273-324. Filter 方法: 如果选用此评价策略,则搜索策略必须用 Ranker 。(1) CorrelationAttributeEval 根据单个属性和类别的相关性进行选择。 Evaluates the worth of an attribute by measuring the correlation (Pearson's) between it and the class. ------------------------------------------------------------------------------------------------ —————————————————————————————————————— Nominal attributes are considered ona value by value basis by treating each value as an indicator. An overall correlation for a nominal attribute is arrived at via a weighted average. (2) GainRatioA

最近更新

大学生上闲鱼项目融资方案 6页

企业质量体系各种管理规范 105页

山东省莱州市一中2022-2023学年高考物理考前最.. 15页

山西平遥县和诚2023年生物高一第一学期期末复.. 5页

广东揭阳市惠来县第一中学2022-2023学年高三压.. 14页

广东省肇庆市端州区南国中学英文校2023届中考.. 24页

广西桂林市全州县2023届中考联考英语试卷含答.. 11页

外卖大闸蟹项目融资方案 6页

江苏省淮安市四校2023年高考仿真模拟英语试卷.. 14页

江苏省靖江外国语校2022-2023学年中考生物最后.. 20页

江西省赣州市宁都县重点名校2023届中考化学考.. 10页

河南省濮阳市台前县重点中学2022-2023学年中考.. 23页

浙江省杭州十四中2023年高三第六次模拟考试物.. 14页

湖北省麻城思源实验校2023届中考化学模拟预测.. 12页

湖南省邵阳市郊区2023年中考化学考前最后一卷.. 14页

福建省德化县2023年中考语文押题试卷含解析 14页

衡阳市重点中学2022-2023学年中考生物考前最后.. 13页

化工原理考研09整理资料 74页

重庆市綦江区2023届中考物理猜题卷含解析 13页

陕西省西安市西电附中2022-2023学年高三第四次.. 14页

黑龙江省鹤岗市工农区鹤岗一中2022-2023学年高.. 14页

培训机构经费预算方案 7页

培训教室实施方案 6页

物业管理概述 87页

阿里巴巴招聘与面试技巧 71页

高二政治教师工作计划范例(精选4篇) 7页

高一语文文言文原文及翻译(精选2篇) 5页

领导辞职报告(通用5篇) 11页

难忘春节作文(通用3篇) 4页

银行辞职报告(精选11篇) 14页