文档介绍:支持向量机预处理算法与学习算法的研究中文摘要支持向量机预处理算法与学习算法研究中文摘要支持向量机结构简洁、泛化性能优越而广泛应用于模式识别、信号处理、图像处理等智能化信息处理领域。该算法等价于求解二次规划,所以在不均衡样本集、大样本集上存在着泛化能力和性能瓶颈的问题。对于不均衡样本集,预处理算法的引入剔除了冗余样本点,减少了支持向量机的训练耗费,但预处理算法没有考虑不同类样本集间规模的差异,这导致了预处理算法效率低下。对于大样本集,分解算法使用工作集策略大大降低了支持向量机训练的复杂度,但现有的工作集选择算法没有充分利用目标函数的信息导致收敛速度不高。本文在现有的学习算法和预处理算法研究的基础上,提出了解决上述问题的相应方法:(1)分析了对于不均衡样本集泛化性能低的原因和和预处理算法参数选取的困难。(2)把样本集的分布信息用于样本集预处理算法中,改进了参数选取方法,剔除了部分冗余样本点,减少了对于不均衡样本集的训练耗费。(3)比较了两种分解算法的工作集选择方案,说明了SVM-LIGHT在工作集选取上的不足之处。(4)把LIBSVM和SVM-LIGHT中的工作集选择方法结合,提出了一种新的基于二次信息的工作集选择方法,并把该方法应用于公共数据集,验证了算法的有效性。最后,作者对所做的工作进行了总结,并对以后的研究工作进行了展望。关键词:支持向量机;k邻域算法:不均衡样本集;可行方向法;二次信息作者:何渊淘指导老师:邓伟AbstractResearchonTrainingAlgorithmandPreprocessingAlgorithmofSuppoaVectorResearchonTrainingAlgorithmandPreprocessingAlgorithmofSupportVectorMachineAbstractSupportVectorMachine(SVM)hasmanyadvantagessuchasperfectgeneralizationperformanceandsimpleform,ithasbeenwidelyusedinthefieldsofpattemrecognition,,(IDS),’tconsideredinthepreprocessingalgorithm,,’,theexistingpreprocessingandlearningalgorithmsareinvestigated,::,andanalyzingthedeficienciesofworkingsetselectionalgorithmusedinsvm·:biningtheworkingsetselectionmethodofl