文档介绍:第31卷,第5期光谱学与光谱分析 ,,pp12082111
2011 年 5 月 SpectroscopyandSpectralAnalysis May,2011
多任务最小二乘支持向量回归机及其在近红外光谱
分析技术中的应用研究
徐硕1,乔晓东1,朱礼军1,安欣2,张录达3
,北京 100038
,北京 100029
,北京 100193
摘要在近红外光谱定量分析中,许多模型分开考虑各种样品成分含量,失去了样品成分间潜在的联系。
针对该问题,文章将建模分析每种样品成分含量的问题看作一个任务,将同时建模分析所有样品成分含量
的问题转换为多任务学习问题。在 LSSVR 的基础上,提出了多任务 LSSVR(MTLSSVR),并给出一种有
效的大规模问题求解算法。最后,以高粱样品数据集为实验材料,建立了三种样品成分(蛋白质,赖氨酸及
淀粉)的同时定量分析模型。三种样品成分的预测值与实际值的平均相对误差分别为 %,% 和
%,,,经分析比较,发现 MTLSSVR 模型优于 PLS,LS
SVR 以及多因变量 LSSVR(MLSSVR),从而验证了 MTLSSVR 模型的可行性和有效性。
关键词近红外光谱;化学计量学;多任务 LSSVR
中图分类号: 文献标识码:A 犇犗犐:.10000593(2011)05120804
Evgeniou等[7]借助 Bayesian MTL 的思想,设计了一种正则
引言化 MTL模型,不过该模型仍需求解一个二次规划问题。本
文在 Evgeniou等[7]工作的基础上,提出了多任务 LSSVR
近红外光谱技术[1]具有操作简单、分析速度快以及测定(MTLSSVR)模型。类似于 LSSVR,该模型也只需求解一
一次光谱可同时获得样品多种成分含量的独特优点,使其在个线性方程组,而且本文也给出了一种有效的大规模问题求
作物品质分析上得到了广泛应用。目前近红外光谱定量分析解算法。最后建模分析了高粱样品的三种成分(蛋白质,赖
采用的化学计量学建模方法比较多,有些已取得了不错的效氨酸及淀粉)含量,平均相对误差和相关系数指标均显著优
果,比如偏最小二乘(PLS)[2]、支持向量回归机(SVR)[3]等。于 PLS,LSSVR 和 MLSSVR。
与其他方法相比,SVR 具有出色的学习及推广能力,但它需
要求解一个二次规划问题,非常耗时。而最小二乘 SVR(LS 1 最小二乘支持向量回归机(LSSVR)
SVR)[4]用等式约束代替不等式约束,只需求解一个线性方
程组,大大加快了求解速度,受到了人们越来越多的重视。
对于狀∈ N,记N狀= {1,2,…,狀}。给定训练数据集
近红外光谱包含了样品中所有成分的光谱信息,但目前犖犱
{(狓犻,狔犻)}犻=1,其中狓犻∈ R ,狔犻∈ R,记狔= (狔1;狔2;…;
许多模型分开考虑样品成分含量,失去了样品成分间潜在