1 / 4
文档名称:

libsvm交叉验证与网格搜索参数选择.doc

格式:doc   大小:56KB   页数:4页
下载后只包含 1 个 DOC 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

libsvm交叉验证与网格搜索参数选择.doc

上传人:小辰GG 2021/10/25 文件大小:56 KB

下载得到文件列表

libsvm交叉验证与网格搜索参数选择.doc

文档介绍

文档介绍:libsvm交叉验证与网格搜索参数选

li bsvm交义验证与网格搜索(参数选择)
臣冰河发表于12: 29添加评论502阅读十212010称先说交义验证。
交叉验证(Cross validation)足一种评佔统计分析、机器学****算法对独立 于训练数据的数据集的泛化能力(generalize),能够避免过拟合问题。
交叉验证一般要尽杲满足:
训练集的比例要足够多,一般大于一半
训练集和测试集要均匀抽样
交义验证上要分成以下儿类:
Double cross-validation Double cross-validation 2-fold cross-validation(2-CV),作法是将数据集分成两个相等大小的了集,进行两 回合的分类器训练。在第一回合中,一个子集作为训练集,另一个作为测试集; 在第二回合中,则将训练集与测试集对换后,再次训练分类器,而其中我们比 较关心的足两次测试集的识别率。不过在实际中2-CV并不常用,主要原因足训 练集样本数太少,通常不足以代表母体样本的分布,导致测试阶段识别率容易 出现明显落差。此外,2-CV中子集的变异度大,往往无法达到「实验过程必须 可以被复制」的要求。
k-folder cross-validation(k 折交义验证)
K-fold cross-validation(k-CV)则足 Double cross-validation 的延伸, 做法是将数据集分成k个子集,每个犷集均做一次测试集,其余的作为训练集。 k-CV交义验证重复k次,每次选择一个子集作为测试集,并将k次的平均交义 验证识别率作为结果。
优点:所有的样本都被作为了训练集和测试集,每个样本都被验证一次。 10-folder通常被使用。
3) leave-one-out cross-validation(LOOCV 留一验证法)
假设数期集中冇n个样本,那LOOCV也就足n-CV,总思、足每个样本单独作 为一次测试集,剩余口-1个样本则做为训练集。
优点:
1) 每一回合中儿乎所有的样本皆用于训练model,因此最接近母体样本的 分布,佔测所得的generalization error比较可靠。因此在实验数拯集样本较 少时,可以考虑使用LOOCVo
2) 实验过程中没冇随机因素会影响实验数据,确保实验过程是可以被复制 的。
,为需姜理万的models数虽与总样本数昴: 相同,、勺总样本数量相X多时,LOOCV在实作上便有困难,除非每次训练model 的速度很快,或是可以用平行化计算减少计算所需的时间。
libsvm 捉供了 void svrn _eross_validcition(const struct
svm problem*prob, const struct svm parameter*param, int nr_fold, double*target)方法,参数含义如下:
prob:待解决的分类问题,就是样本数据。
param: svm训练参数。
nr_fold:顾名思义就足k折交义验证中的k,如果k二n的话就是留一法了。
target:预测值,如果是分类问题的话就是类别标签了。
然后我们讨论下参数选择。
使用svm,无论是libsv