文档介绍:支持向量机(supportvectormachine,SVM)WangJiminNov18,2005OutlineSVM的理论基础线性判别函数和判别面最优分类面支持向量机SVM的研究与应用SVM的理论基础传统的统计模式识别方法只有在样本趋向无穷大时,其性能才有理论的保证。统计学习理论(STL)研究有限样本情况下的机器学习问题。SVM的理论基础就是统计学习理论。传统的统计模式识别方法在进行机器学习时,强调经验风险最小化。而单纯的经验风险最小化会产生“过学习问题”,其推广能力较差。推广能力是指:将学习机器(即预测函数,或称学习函数、学习模型)对未来输出进行正确预测的能力。过学习问题“过学习问题”:某些情况下,当训练误差过小反而会导致推广能力的下降。例如:对一组训练样本(x,y),x分布在实数范围内,y取值在[0,1]之间。无论这些样本是由什么模型产生的,我们总可以用y=sin(w*x)去拟合,,因此SVM的解是全局唯一的最优解SVM在解决小样本、非线性及高维模式识别问题中表现出许多特有的优势,并能够推广应用到函数拟合等其他机器学习问题中Joachims最近采用SVM在Reuters-21578来进行文本分类,并声称它比当前发表的其他方法都好线性判别函数和判别面一个线性判别函数(discriminantfunction)是指由x的各个分量的线性组合而成的函数两类情况:对于两类问题的决策规则为如果g(x)>0,则判定x属于C1,如果g(x)<0,则判定x属于C2,如果g(x)=0,则可以将x任意分到某一类或者拒绝判定。线性判别函数下图表示一个简单的线性分类器,具有d个输入的单元,每个对应一个输入向量在各维上的分量值。该图类似于一个神经元。超平面方程g(x)=0定义了一个判定面,它把归类于C1的点与归类于C2的点分开来。当g(x)是线性函数时,这个平面被称为“超平面”(hyperplane)。当x1和x2都在判定面上时,这表明w和超平面上任意向量正交,并称w为超平面的法向量。注意到:x1-x2表示超平面上的一个向量