文档介绍:该【果品品质的近红外光谱无损检测建模分析关键技术研究样本 】是由【jimilu】上传分享,文档一共【17】页,该文档可以免费在线阅读,需要了解更多关于【果品品质的近红外光谱无损检测建模分析关键技术研究样本 】的内容,可以使用淘豆网的站内搜索功能,选择自己适合的文档,以下文字是截取该文章内的部分文字,如需要获得完整电子版,请下载此文档到您的设备,方便您编辑和打印。资料内容仅供您学习参考,如有不当或者侵权,请联系改正或者删除。
一、 选题的目的与意义
随着的显著提高, 新鲜果品及各种水果制品以其独特的口感和丰富的营养价值逐渐成为人们继主食之后的最主要休闲食品之一。中国是世界第一大水果生产和消费国, 除粮食、 蔬菜之外, 水果在国内已成为第三大种植产品, 在农业和农村经济发展中更是占据着十分重要的地位。据国家统计局 发布的信息显示: 中国苹果、 梨、 桃、 李和柿子的产量均居于世界前5位; 特别是柿子和梨, %%; 苹果和梨的产量也占世界产量的40%左右; 另外, 猕猴桃、 柑桔、 葡萄、 香蕉等产量也呈急剧上升趋势。虽然这些年中国水果产量在世界始终处于前列, 但原果品质以及水果加工制品质量却与世界发达国家相比存在很大的差距, 这也是限制中国水果产业健康发展并走向世界的巨大瓶颈( 李辰 ) 。导致这种差距的主要原因归结于果实田间生长期间、 采摘后储藏过程中以及后续加工环节里未能及时、 全面掌握果品品质变化, 准确、 客观了解果实品质特性。
果品的品质特性一般根据其糖度、 硬度、 酸度、 颜色、 形状和产地等多种指标来综合评价。在国家标准及进出口检验中, 常经过检测糖度、 硬度和酸度来评价果品的品质特性, 但因各种水果的品质差异较大, 实际检测中可根据具体情况选取合适的测定指标。当前, 国内仍多采用传统破坏式检测方法对果品品质进行评价, 即选取一定实验样本, 经复杂的预处理后、 经过破坏样品组织结构的方法来检测所需物化指标的方法, 该方法不但费时费力、 浪费样品, 而且难以实现大批量样品的分析和生产、 加工环节中的实时在线检测。因此, 利用先进的现代无损检测技术代替传统检测方法对于实现果品的生产、 储藏、 加工及流通各环节的质量控制与品质保证, 从而突破我们果品产业发展瓶颈具有非常重要的实际意义。所谓无损检测技术是在不破坏检测样品的前提下, 利用对象内部结构特异性及组分含量多少所引起的对热、 声、 光、 电、 磁等反应的变化, 来探测各种农产品内部指标。根据检测方法不同大致能够分为光学特性分析法、 声学特性分析法、 机器视觉技术分析法、 电学特性分析法、 核磁共振检测技术与X射线检测技术等(徐惠荣 )。以上各种无损检测技术在研究和实际生产中得到了不同程度的应用, 其中, 近红外光谱技术因其高效率、 低成本、 易操作和方便多组分同时检测等诸多优点, 被分析化学界誉为
资料内容仅供您学习参考,如有不当或者侵权,请联系改正或者删除。
”分析巨人”, 特别随着近年来计算机技术和化学计量学的高速发展, 更被广泛应用于农业、 石油、 化工、 医药和生物等各个方面。
近年来, 国内外在利用近红外光谱技术进行各类果品品质检测以及开发在线实时果品品质检测装置和便携式果品检测仪器方面的报道很多。但在国内外诸多研究中近红外分析模型普遍存在着”欠拟合”与”过拟合”问题, 而高质量的模型应该具有建模样本少、 速度快、 精度高和适应性强等特点, 这也是决定近红外光谱技术能否在果品品质检测中被更广泛应用的关键所在。近红外光谱分析关键技术主要包括三方面: 建模样本的优选、 有效光谱信息的提取以及建模方法的选择。其中, 任何一个环节方法选择的不合理或操作的不科学, 将直接对分析模型造成重要的影响, 甚至关乎整个建模分析的可行与否。因此, 系统研究近红外光谱分析中各关键技术, 经过综合比较选取各单元操作最佳方法, 对于优化模型、 提高预测精度、 增强模型适应性以及改进模型稳健性等都具有非常重要的意义。为此, 本文旨在对成熟期及采收储藏期的果品品质的近红外光谱分析过程中, 经过对建模样品的优选( 相似与异常样品的剔除、 校正集与验证机的划分) 、 有效光谱信息的提取( 特征波长与特征区域的选取) 和建模方法的选取( 线性回归与非线性拟合) 各关键环节进行系统研究, 综合分析选取各环节处理方法, 建立高效、 准确、 适用和稳健的最优品质分析模型, 也为便携式近红外果品品质检测仪的开发提供技术支撑。
二、 选题的依据
近红外光谱( NIRs) 是介于可见光谱区和中红外光谱区之间波长780~2526nm( 波数12820~3959cm-1) 的电磁波( 陆婉珍 ) 。近红外光谱的主要信息为物质含氢基团( 包括O-H、 N-H、 C-H等) 对近红外光的倍频与合频吸收, 这使得近红外光谱技术不但能够检测物质中与这些基团相关的组分, 如糖度、 酸度、 蛋白质、 淀粉、 脂肪和氨基酸等, 而且可用于分析物质的密度、 硬度和粘度等性质( 郭文川等 ) 。比尔—朗贝定律(The Beer-Lambert Law)是近红外光谱分析中的一个重要定律, 它奠定了近红外光谱分析的基础: 将所研究的样品组分的浓度值与经过仪器测量得到的光谱值之间的关系进行关联
资料内容仅供您学习参考,如有不当或者侵权,请联系改正或者删除。
( 刘建学 ) , 即:
其中, —样品在特定波长( 或频率) 的吸光度;
—样品的所研究组分在该特定波长下的吸光系数;
—光程, 即光经过样品的行程;
—样品中所研究组分的浓度值。
然而, 近红外谱区谱峰重叠非常严重, 谱峰比较宽, 谱区的可解析性很差, 一般很难确定某一组分对应的特征谱峰, 进行直接定量分析是非常困难的。因此, 这便要求结合化学计量学方法从复杂的数据中提取尽可能多的有效信息后进行建模分析。水果主要包含水分、 糖类、 蛋白质、 脂肪以及维生素等成分, 其中绝大多数成分化学组成中均含有近红外光的特定吸收基团, 各组分在近红外区域具有不同的特征吸收光谱, 这也为利用近红外光谱分析果品品质提供了有力的理论依据。
果品的近红外光谱检测方式一般有三种: 反射光检测、 漫反射检测和透射光检测, 这三种光谱采集手段各有所长, 其中漫反射光谱检测是一种介于反射与透射之间能够较客观反映水果内部的组织结构特性, 并在常见水果品质测定中被广泛采用的研究方法( 王多加等 ) 。在果品品质常规检测中, 根据果品内部主要成分及结构特点, 常利用近红外光谱技术分析果品表观缺陷、 表面颜色和内部成分含量如可溶性固形物、 硬度、 酸度以及干物质等多个代表性指标( 杨春梅等 ) 。
水果样品处理与光谱采集
样品光谱的预处理过程
测定样品各内部成分含量
未知样本适应性判断
数学模型建立及精度验证
预测未知样品的成分含量
未知成分的水果光谱采集
图1 近红外光谱分析技术的一般流程框图
资料内容仅供您学习参考,如有不当或者侵权,请联系改正或者删除。
利用近红外光谱技术定量检测果品品质的大致流程图如图一所示, 该分析过程主要结合以下关键技术实现:
( 1) 代表性样品优选技术
在近红外光谱分析中, 建模样品的科学选取, 即代表性强、 数量适当和分布均匀的建模样品对所建模型的预测性能具有直接的影响, 该环节具体包括相似、 异常样品的剔除、 校正集与验证集样品的合理划分等关键方法。其中, 常见的相似或异常样品的剔除思想为: 基于预测浓度残差、 基于重构光谱残差、 光谱PLS分解主成分得分的聚类分析, 以及杠杆值与学生T检验等准则( 闵顺耕等 ) ; 建模样品集的科学划分方法常根据样品光谱的积累和性质或组成数据的分布来选择建立定标集的样品, 并经过部分样品进行验证: 含量梯度法、 Duplex算法、 Kennard-Stone法、 GN距离法以及SPXY算法等( 吴静珠等 ) 。
( 2) 光谱数据预处理技术
光谱采集过程中由于仪器、 环境变化、 操作等因素, 会产生多种干扰, 直接影响光谱质量, 而经过多种预处理技术可对原始光谱数据进行消噪、 数据提取与压缩等目的, 从而提高数据质量, 使经预处理后的光谱客观的反映物质组分与结构信息, 这对于高性能模型的建立非常关键。常见光谱数据预处理技术主要有, 微分方法、 多元散射校正方法、 平滑方法、 归一化方法、 标准正态变换和小波变换等技术( 褚小立等 ) 。
( 3) 光谱信息筛选技术
样品光谱的产生受到样品的成分、 成分之间的相互作用、 光谱仪及样品前处理等多种因素的影响, 近红外光谱分析是从分析样品光谱复杂、 重叠和变动的背景中提取信息( 洪涯等 ) 。建模谱区的优选不但能够简化模型, 更重要的是能将不相关或非线性变量进行剔除, 增强校正模型的预测能力( 孙旭东等 ) 。当前有效建模光谱波段和波长的选择方法主要有相关分析法、 逐步回归法、 无信息变量的消除法(UVE)、 间隔偏最小二乘法(iPLS) 、 模拟退火算法( SAA) 、 多链方法( MCM) 和遗传算法(GA)等。
资料内容仅供您学习参考,如有不当或者侵权,请联系改正或者删除。
( 4) 模型定量校正技术
定量校正方法的选取是近红外光谱检测中起决定性作用的一个环节, 利用适当、 有效的定量校正方法将果品品质指标与内部成分的光谱信息进行关联、 拟合, 能够保证模型建模效率高、 预测精度好、 适应性强。在近红外分析中常见的定量校正校正方法有多元线性回归法( MLR) 、 主成分回归法( PCR) 、 偏最小二乘法( PLS) 、 人工神经网络法( ANN) 以及拓扑方法( TP) 等( 刘建学 ) 。
以上各建模分析关键技术中都需采用各不同的优选算法及定量校正方法, 以下对实际研究分析中最可能采用的关键技术方法、 算法原理进行简单介绍:
SPXY建模集样品划分方法是Galvao等人在 提出来的基于x-y距离结合的样本划分方法( sample set partitioning based on joint x-y distance, SPXY) , 该方法是在K-S法的基础上发展起来的, 可有效地用于NIR定量模型的建立, 优点在于能够有效地覆盖多维向量空间, 从而改进所建模型的预测能力( Galvao et al. ) 。用dx(p,q)代替dy(p,q), 同时为了确保样本在X和Y空间具有相同的权重, 将dx(p,q)和dy(p,q)分别除以它们在数据集中的最大值, 因此标准化的xy的距离公式为:
连续投影算法( Successive Projection Algorithm, SPA) 是一种前向循环的变量选择方法, 能够从严重重叠的光谱信息中提取有效信息, 目的是选择那些最小冗余信息量的波长, 解决共线性问题。除了用于光谱变量的选择, SPA亦可用于确定由主成分分析所得到的主成分的最佳主成分组合( 陈斌等 ) 。
遗传算法( Genetic Algorithms, GA) 在近红外光谱建模分析中样品优选、 特征光谱波长提取以及人工神经网络的优化方面都有着广泛的应用。它经过全面模拟自然选择和遗传机制, 形成了一种以”生成+检验”特征的自适应全局的概率搜索算法( 李敏强等 ) 。其实现基本流程如图2所示:
资料内容仅供您学习参考,如有不当或者侵权,请联系改正或者删除。
确定实际问题参数集
对参数集进行编码
初始化群体P( t)
评价群体
满足停止准则
YES
结束
遗传操作
群体P(t)
群体P(t+1)
No
位串解码的参数;
计算目标函数值;
函数值向适应值映射;
适应值调整
1)选择;
2)交叉;
3)变异;
其它高级算子
适应值调整
图2 简单遗传算法基本流程框图
人工神经网络(Artificial Neural Networks, 简写为ANN)是对人脑或自然神经网络(Natural Neural Network)若干基本特性的抽象和模拟。它在一定程度和层次上模仿了人脑人经系统的信息处理、 存储及检索功能, 因而具有学忆和计算等智能处理功能。人工神经网络具有强大的信息处理能力, 在近红外光谱非线性校正建模分析中有着广泛的应用前景。人工神经网络因连接方式的不同也表现为各种形式的网络模型, 而在果品品质的近红外光谱检测建模分析中常见到的为BP网络和RBF网络, 其基本网络结构图如图3所示。其中, BP网络算法的基本思想是, 学习过程由信号的正向传播和误差的反向传播两个过程组成。正向传播时, 输入样本从输入层传入, 经各隐层逐层处理后, 传向输入层。若输入层的实际输出与期望的输出不符, 则转入误差的反向传播阶段。误差反传是将输出误差以某种形式经过隐层向输入层逐层反传, 并将误差分摊给各层的所有单元, 从而获得各层单元的误差信号, 此误差信号即作为修正各单元权值的依据。随着该过程周而复始的进行, 权值不断得到调整, 指导网络输出的误差减少到可接受的程度或进行到预先设定的学习次数为止。RBF是在借鉴生物局部调节和交叠接受区域知识的基础上提出的一种采用局部接受域来执行函数映射的人工神经网络, 具有最优逼近和全局逼近的特性。在RBF 中, 输入层到隐含层的基函数输出是一种非线性映射, 而输出则是线性的。这样, RBF 网络能够看成是首先将原始的非线性可分的特征空间, 变换到另一线性可分的空间( 一般是高维空间) , 经过合理选择这一变换使在新空间中原问题线性可分, 然后用一个线性单元来解决问题, 从而很容易的达到从非线性输入空间向输出空间映射的目的( 韩力群 ) 。
资料内容仅供您学习参考,如有不当或者侵权,请联系改正或者删除。
X1
X2
X3
Xn
W1
Y1
Y2
Y3
Yn
W2
输入层
Input layer
隐含层
Hidden layer layer
输出层
Output layer
图3 人工神经网络基本模型
三、 国内外研究概况
国外应用近红外光谱技术进行果品品质的研究比国内要早得多, 而且也取得了很多研究成果。Dull等( 1989) 选取880nm和913nm两个波段的单色光, 结合偏最小二乘( PLS) 法无损检测甜瓜和哈密瓜的可溶性固形物含量( SSC) 。Kawano等( 1992) 在光谱范围为680-1237nm, 利用样本的二次微分光谱结合多元线性回归( MLR) 方法建立了柑橘糖度的近红外透射光谱模型。Slaughter(1995)在400-1000nm波长范围内, 经过平滑和二阶微分处理光谱建立了成熟与未成熟梨和桃糖度、 叶绿素A以及山梨醇的PLS模型, 预测结果可基本满足实际需要。Lammertyn等( 1998) 利用可见和近红外光谱无损检测了苹果的品质特性, 建立了反射光谱与水果PH值、 可溶性固形物含量、 硬度以及其它结构参数的关系, 并采用主成分分析( PCA) 、 主成分回归( PCR) 和PLS方法进行了建模分析。Peirs等( 1999) 经过对苹果、 甜瓜、 蜜瓜、 芒果、 梨、 土豆、 洋葱等七种果蔬实验, 探索了不同品种水果在不同部位SSC及干物质含量( DMC) 与光谱数据的关系, 结果表明蜜瓜的SSC变异系数最大( %) , 土豆的SSC变异系数最小( %) 。Schmilovitch等( ) 利用近红外光谱结合MLR、 PCA和PLS等方法, 预测了芒果的SSC, 酸度和果肉硬度, 比较而言, MLR模型效果效果最佳, 、 ( ) 利用傅立叶近红外光谱检测技术快速测定水果果汁的糖度, 结果表明采用投射光检测方式效果更好一些。McGlone等( ) 利用500-1100nm波长光谱检测了'Royal Gala'苹果内部成分中淀粉、 SSC和酸度, %-%。Manuela等( ) 在300-1100nm波长范围内建立个3个不同品种苹果的叶绿素含量模型, -。Carlomagno等( ) 利用近红外透射光谱( 730nm-900nm) 对不同成熟度桃进行了聚类判别分析, 以桃子硬度和糖度为成熟度指标, 原始光谱经小波包变换滤噪后进行分析, %。Antihus等( ) 利用可见/近红外光谱检测无核小蜜橘的酸度、 SSC和坚实度等品质, 结合PCA和PLS方法建立模型, -, -。Panmanas等( ) 在1100nm-2500nm波长范围内, 结合二阶微分光谱与MLR建立了2两年采收的日本梨的果胶组成数学模型, 结果显示, 本年的模型不可用于预测其它年的样品。Sinelli等( ) 利用近/中红外反射光谱无损测定蓝莓的营养成分, 采用PLS方法建立模型。实验结果显示在在近红外反射光谱区域能预测出酚类、 类黄酮和花青素总含量, 而在中红外区域能估计分类成分的含量。Moghimi
资料内容仅供您学习参考,如有不当或者侵权,请联系改正或者删除。
等( ) 在400-1000nm波长范围内, 对比了不同光谱预处理方法, 并建立了猕猴桃可溶性固形物和pH值的PCR和PLS模型, 结果表明近红外光谱技术可适用于该果品这两个品质指标的检测。
20世纪90年代以来, 中国近红外光谱技术的应用有了快速的发展, 但相对于国外研究与应用现状而言, 国内的研究相对较晚, 进展比较缓慢。金同铭等( 1995) 利用短波近红外光谱对草莓、 黄瓜和苹果中的维生素C进行了测定。陈世铭等( 1998) 在1000-2500nm波长范围内, 分别利用MLR、 PLS与人工神经网络( AAN) 定量校正方法建立了水蜜桃和洋香瓜等果汁的糖度预测模型。何东健等( ) 介绍了桃近红外无损检测装置的基本原理和组成, 并经过实验表明赤道上与缝线呈90
资料内容仅供您学习参考,如有不当或者侵权,请联系改正或者删除。
o的部位, 可代表平均糖度。应义斌等( ) 对3种不同近红外检测方式的原理进行了概述和分析, 认为剥皮水果糖度和酸度最适合用漫反射光谱进行检测。赵文杰等( ) 在1300-2100nm波长范围内, 分别建立了苹果糖度的PCR和PLS模型, 结果表明, PLS模型优于PCR模型。刘燕德等( ) 利用近红外漫反射技术探讨了水果糖度无损检测方法, 试验中引入了遗传算法优选光谱, 结果表明, 经优选后建模效率增强、 模型预测精度改进。王加华等( ) 结合遗传算法( GA) 和PLS建立了西洋梨的糖度预测模型, 结果表明该方法切实可行的, 并可有效提高测量精度, 减少建模变量。孙旭东等( ) 在600-980nm波长范围内, 分别利用径向基函数神经网络( RBF) 和反向传播神经网络( BP) 建立了南丰蜜橘可溶性固形物含量的非线性数学模型, 研究结果表明: 径向基函数神经网络比反向神经网络获得的预测结果更好, 。洪涯等( ) 利用SPXY方法划分样本集后, 结合连续投影算法( SPA) 优选出全光谱 个变量中的9个, 建立了砂糖橘总酸含量的MLR和PLS模型, 结果表明变量优选前后模型预测精度相当, SPA可极大提高建模效率。郝勇等( ) 在利用近红外光谱分析梨硬度和表面色泽的研究中, 分别采用蒙特卡罗无信息变量消除( MC-UVE) 和小波变换( WT) 的蒙特卡罗无信息变量消除方法筛选了各指标的光谱变量。WT-MC-UVE方法能够有效地选择建模变量, 而且既能提高模型的稳定性, 又能提高多元校正的预测精度。
当前国内外利用近红外光谱分析技术研究果品品质特性的报道很多, 但大多数研究多集中在利用近红外光谱结合常规定量校正方法对各种类繁多的果品品质进行分析。虽然研究材料已基本涉及到全球各大宗果品、 检测指标也能满足评价果品品质的各项要求, 但对于综合、 系统研究果品品质近红外光谱建模分析过程中关键技术和方法( 即包括光谱预处理、 建模样品的优选、 光谱信息的有效筛选与提取和线性与非线性定量校正方法的选取等) 对预测模型效果影响的研究却
资料内容仅供您学习参考,如有不当或者侵权,请联系改正或者删除。
少有报道, 这也是直接关系果品品质分析模型预测精度、 稳健性和适用性的关键环节。
四、 研究内容
本论文, 采用近红外漫反射光谱技术, 以猕猴桃、 桃和梨为研究对象, 以其可溶性固形物、 pH值、 硬度和总酸( TA) 为品质评价指标在833-2500nm( 1 -4000cm-1) 波长范围内, 综合、 系统研究果品品质检测的近红外光谱检测分析中, 建模样品优选、 有效特征光谱信息的筛选与提取以及建模定量校正方法的选取和优化对模型预测性能的影响, 并经过综合比较试验, 选取果品品质指标近红外光谱检测建模分析中的最佳处理技术和方法, 确定最优分析模型。主要研究内容如下所述:
( 1) 研究相似样品和异常样品的剔除对梨糖度和硬度模型预测性能的影响;
( 2) 研究不同校正集样品和预测集样品划分方法对梨糖度和硬度模型预测性能的影响。
( 1) 研究不同光谱预处理方法对猕猴桃糖度、 硬度和总酸模型预测性能的影响;
( 2) 研究不同特征波长( 波段) 对猕猴桃糖度、 硬度和总酸模型预测性能的影响。
五、 研究方法及技术路线
本研究部分以 8月4日— 9月30日, 分5次采摘于陕西杨凌杨家乡马家底村一果园生长、 成熟期的175个”砀山酥”梨和160个”雪花”梨为研究材料, 。
综合比较PCA结合马氏距离法、 遗传算法和基于浓度残差与光谱残差的二审剔除法对梨糖度与硬度建模效果的影响;