文档介绍:一、属性选择:
1、理论知识:
见以下两篇文章:
数据挖掘中的特征选择算法综述及基丁WEK的性能比较良龙
数据挖掘中约简技术与届性选择的研究辉2、weka中的属性选择评价策略(attributeevaluator)
:63-91.
PrincipalComponents
主成分分析(PCA。
---(95%).
AttributenoisecanbefilteredbytransformingtothePCspace,eliminatingsomeoftheworsteigenvectors,andthentransformingbacktotheoriginalspace.
ReliefFAttributeEval
根据ReliefF值评估届性。
.
Formoreinformationsee:
KenjiKira,::NinthInternationalWorkshoponMachineLearning,249-256,1992.
IgorKononenko:EstimatingAttributes::EuropeanConferenceonMachineLearning,171-182,1994.
MarkoRobnik-Sikonja,IgorKononenko::FourteenthInternationalConferenceonMachineLearning,296-304,1997.
SymmetricalUncertAttributeEval
根据届性的对称不确定性评估届性。
Evaluatestheworthofanattributebymeasuringthesymmetricaluncertaintywithrespecttotheclass.
SymmU(Class,Attribute)=2*(H(Class)-H(Class|Attribute))/H(Class)+H(Attribute).
搜索策略(SearchMethod)
BestFirst
最好优先的搜索策略。是一种贪心搜索策略。
-,orstartwiththefullsetofattributesandsearchbackward,orstartatanypointandsearchinbothdirections(byconsideringallpossiblesingleattributeadditionsanddeletionsatagivenpoint).
ExhaustiveSearch
穷举搜索所有可能的届性子集。
Performsanexhaustive