文档介绍:支持向量机Csupportveetormachine,SVM).Outline口SVM的理论基础口线性判别函数和判别面口最优分类面口支持向量机口SVM的研究与应用信息种学故术学院阀辂研宽所∥亲滲SVM的理论基础口传统的统计模式识别方法只有在样本趋向无穷大时,其性能才有理论的保证。统计学习理论(STL)研究有限样本情况下的机器学习问题。SVM的理论基础就是统计学习理论。口传统的统计模式识别方法在进行机器学习时,强调经验风险最小化。而单纯的经验风险最小化会产生“过学习问题”,其推广能力较差。口推广能力是指:将学习机器(即预测函数,或称学习函数、学习模型)对未来输出进行正确预测的能力信息种学故术学院阀辂研宽所∥亲滲过学习问题口“过学习问题”:某些情况下,当训练误差过小反而会导致推广能力的下降。口例如:对一组训练样本(x,y),x分布在实数范围内,y取值在[0,1之间。无论这些样本是由什么模型产生的,我们总可以用y=sin(wx)去拟合,使得训练误差为0信息种学故术学院阀辂研宽所∥亲滲SVM口根据统计学习理论,学习机器的实际风险由经验风险值和置信范围值两部分组成。而基于经验风险最小化准则的学习方法只强调了训练样本的经验风险最小误差,没有最小化置信范围值,因此其推广能力较差。口Vapnik提出的支持向量机(SupportVectorMachine,SVM)以训练误差作为优化问题的约束条件,以置信范围值最小化作为优化目标,即SⅤM是一种基于结构风险最小化准则的学习方法,其推广能力明显优于一些传统的学习方法。口形成时期在1992—1995年。信息种学故术学院阀辂研宽所∥亲滲SVM口由于SVM的求解最后转化成二次规划问题的求解,因此SⅥM的解是全局唯一的最优解口SⅤM在解决小样本、非线性及高维模式识别问题中表现出许多特有的优势,并能够推广应用到函数拟合等其他机器学习问题中口Joachims最近采用SWM在Reuters-21578来进行文本分类,并声称它比当前发表的其他方法都好信息种学故术学院阀辂研宽所∥亲滲线性判别函数和判别面口一个线性判别函数discriminantfunction)是指由x的各个分量的线性组合而成的函数g(x)=w'x+w口两类情况:对于两类间题的决策规则为口如果g(x>0,则判定x属于C1,口如果g(x)<0,则判定x属于C2口如果g(x)=0,则可以将x任意分到某一类或者拒绝判定信息种学技□□线性判别函数口下图表示一个简单的线性分类器,具有d个输入的单元,每个对应一个输入量在各维上的分量值。该图类似于一个神经元(x)=w'x+wobiasunitpulluts超平面口方程g(x)=0定义了一个判定面,它把归类于C1的点与归类于C2的点分开来。口当g(x)是线性函数时,这个平面被称为“超平面”(hyperplane)口当x1和x2都在判定面上时,或者口这表明w和超平面上任意向量正交,并称w为超平面的法向量。注意到:x1x2表示超平面上的一个向量信息