1 / 13
文档名称:

机器学习工具WEKA的使用,包括算法选择、属性选择、参数优化技术分析.docx

格式:docx   大小:144KB   页数:13页
下载后只包含 1 个 DOCX 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

机器学习工具WEKA的使用,包括算法选择、属性选择、参数优化技术分析.docx

上传人:s0012230 2017/2/18 文件大小:144 KB

下载得到文件列表

机器学习工具WEKA的使用,包括算法选择、属性选择、参数优化技术分析.docx

文档介绍

文档介绍:一、属性选择: 1 、理论知识: 见以下两篇文章: 数据挖掘中的特征选择算法综述及基于 WEKA 的性能比较_陈良龙数据挖掘中约简技术与属性选择的研究_刘辉 2、 weka 中的属性选择 评价策略( attribute evaluator ) 总的可分为 filter 和 wrapper 方法,前者注重对单个属性进行评价,后者侧重对特征子集进行评价。 Wrapper 方法有: CfsSubsetEval Filter 方法有: CorrelationAttributeEval Wrapper 方法: (1) CfsSubsetEval 根据属性子集中每一个特征的预测能力以及它们之间的关联性进行评估,单个特征预测能力强且特征子集内的相关性低的子集表现好。 Evaluates the worth ofa subset of attributes by considering the individual predictive ability of each feature along with the degree of redundancy between of features that are highly correlated with the class while having low intercorrelation are preferred. For more information see: M. A. Hall (1998). Correlation-based Feature Subset Selection for Machine Learning. Hamilton, New Zealand. ( 2) WrapperSubsetEval Wrapper 方法中, 用后续的学****算法嵌入到特征选择过程中,通过测试特征子集在此算法上的预测性能来决定其优劣,而极少关注特征子集中每个特征的预测性能。因此,并不要求最优特征子集中的每个特征都是最优的。 Evaluates attribute sets by using a learning scheme. Cross validation is used to estimate the accuracy of the learning scheme for a set of attributes. For more information see: Ron Kohavi, e H. John (1997). Wrappers for feature subset selection. Artificial Intelligence. 97(1-2):273-324. Filter 方法: 如果选用此评价策略,则搜索策略必须用 Ranker 。(1) CorrelationAttributeEval 根据单个属性和类别的相关性进行选择。 Evaluates the worth of an attribute by measuring the correlation (Pearson's) between it and the class. Nominal attributes are considered ona value by value basis by treating each value as an indicator. An overall correlation for a nominal attribute is arrived at via a weighted average. ( 2) GainRatioAttributeEval 根据信息增益比选择属性。 Evaluates the worth of an attribute by measuring the gain ratio with respect to the class. GainR(Class, Attribute) = (H(Class) - H(Class | Attribute)) / H(Attribute). ( 3) InfoGainAttributeEval 根据信息增益选择属性。 Evaluates the worth of an attribute by measuring the information gain with respect to the class. InfoGain(Class,Attribute) = H(Class) - H(Class | Attribute). ( 4) OneRAttributeEval 根据 OneR 分类器评估属性。 Class for building

最近更新

重难点解析广西南宁市第八中学物理八年级下册.. 21页

重难点解析广东茂名市高州中学物理八年级下册.. 22页

重难点解析广东深圳市高级中学物理八年级下册.. 19页

重难点解析广东广州市广大附中物理八年级下册.. 20页

2024年小学开展端午节的活动方案[集锦2篇] 5页

重难点解析山西太原市外国语学校物理八年级下.. 19页

2024年小学庆六一儿童节的活动总结范文(通用.. 11页

重难点解析天津南开大附属中物理八年级下册期.. 22页

重难点解析四川绵阳南山双语学校物理八年级下.. 21页

2024年小学少先队辅导员述职报告 61页

重难点解析四川泸县四中物理八年级下册期末考.. 20页

2024年小学少先大队第二学期工作总结 9页

2024年小学寒假日记[精选] 13页

2024年小学寒假优秀日记范文(通用15篇) 13页

2024年小学家长学校年度简洁工作总结 9页

2024年小学家长会优秀家长代表发言稿范文(精.. 41页

重难点解析四川峨眉第二中学物理八年级下册期.. 20页

2024年小学实验室工作总结15篇(优秀) 30页

重难点解析北京市西城区育才学校物理八年级下.. 20页

2024年天津市初中会考生物试卷 8页

毕业设计——回转轴零件的数控车床加工 13页

人教版数学二年级下册期中测试卷+答案 5套 38页

48位著名游资悟道心得 3页

腰椎穿刺术后的护理PPT课件 10页

乒乓球二级裁判题 5页

中考60分作文评分标准(共1页) 1页

JGJ130-2021-建筑施工扣件式钢管脚手架安全技.. 25页

土钉墙工程量计算 3页

电热水壶手柄塑料模具设计本科毕业设计说明书.. 48页