基于近红外光谱分析技术的转Bt基因水稻种子及其亲本快速鉴别方法

2022-03-05 09:50:32 | 浏览次数:

zoޛ)j馐mvR8MtOt^t餄0K])v]4]m5]ӽimN4]4
nZ-MvM^ǻhwnw/u]4y]5mmuuui r'*^rڔ7ǁ]z�vvtXԩy4iutMIӝ74םjZmצKH]5ӝ]~tMz}6wu]H�?^?xRTyDvIDͶ馝uM5M']tntyMmvi;n)j(^ơ检查光谱数据的非线性程度。经计算,Durbin-Watson测试值d为1.548,大于临界值 dH=1.40,表明模型残差不相关存在非线性结构,Run测试法的检验值Z为2.316,大于临界值1.96。试验结果表明,采集到的光谱数据存在显著的非线性结构。此外,增强偏残差图分析法[19]也用来确定采集到的光谱数据中是否存在非线性结构。图3为第1主成分(PC1)与前6个主成分残差多项式拟合的结果,由此可以看出数据集存在显著的非线性结构。

2.3 线性与非线性降维方法比较

图4是分别采用线性降维方法PCA、多维尺度变换以及非线性降维方法ISOMAP提取的特征波长,结合最小二乘支持向量机回归分析方法得到的建模集样本的预测精度与本真维数之间的关系曲线。使用ISOMAP算法进行降維时有2个参数须要调整,分别是邻域参数k和样本本真维数d。在不同参数组合下,基于ISOMAP的最小二乘支持向量机模型得到不同的预测效果。本研究参数优化采用网格搜索法和留一法验证法,对光谱数据建模集分别选取k∈[5,20]、d∈[5,100]作ISOMAP降维,再用最小二乘支持向量机进行回归建立转基因水稻种子及其亲本的校正模型。从图4可以看出,利用非线性流形降维方法ISOMAP提取的特征波长进行回归预测得到的精度比线性降维方法PCA和多维尺度变换高。采用ISOMAP非线性流形降维方法预测精度随着维数的增加逐渐提高,当邻域参数k=5、本真维数d=45时,预测精度达到最高,为94.67%。2种线性降维方法PCA和多维尺度变换提取的特征波长进行回归预测的效果相差不大,最高预测精度分别为75.31%和78.62%,对应的特征波长维数分别为40和60。通过比较分析可得,非线性降维方法能够更好地发现数据集的聚类性质,揭示实际数据的非线性结构。

2.4 最小二乘支持向量机建模及预测

本研究采用了二步格点搜索法对参数γ和δ2进行优化,参数γ的选择范围设定为2-1~210,δ设定为2~215。寻优过程由粗选和精选2个步骤组成:粗选搜索步长较大,最优参数范围由误差等高线确立;精选在粗选基础上,采用较小步长进行搜索,最终确定最优模型参数,寻优结果得到最优的γ和δ2分别为43.598和11.368。为了评估最小二乘支持向量机模型鉴别转基因水稻种子及其亲本的鲁棒性,计算了预测结果的混淆矩阵和精度-召回曲线。从图5-a可以看出,最小

二乘支持向量机回归模型对克螟稻2号和秀水11的分类精度达到了100%,所有的样本都被正确判别出。克螟稻1号有16%被误判为秀水11。图5-b是精度-召回曲线,平均准确率是计算所有精度-召回曲线上的单点局部值的平均准确度,考虑了样本总体分类效果,计算得到MAP指数为 0.97。分类结果说明近红外光谱技术能够实现转基因水稻种子及其亲本的无损、快速检测。

3 结论

利用近红外光谱技术对转基因水稻种子及其亲本进行了判别研究。根据Durbin-Watson测试法和Run测试法检查光谱数据的非线性程度,检测结果表明,光谱数据中存在非线性结构, 因此须要进一步采用非线性流形降维ISOMAP法对近红外光谱数据进行降维,来获取有效光谱信息,将ISOMAP提取的本真光谱结构作为最小二乘支持向量机的输入实现近红外光谱的非线性建模,达到总体识别精度为 94.67%,平均准确率指数为0.97,提出的检测方法比常规的化学方法简单、操作性强。本研究为流形学习算法引入近红外光谱建模提供了一种有益尝试,为今后转基因水稻种子的快速无损检测提供了新的方法。

参考文献:

[1]俞 超,张 吉,叶生晅,等. Bt转基因水稻生理生化特性研究初报[J]. 江苏农业科学,2008(4):31-33.

[2]刘 凯,杨亚军,田俊策,等. 不同氮肥水平下转Bt基因水稻对褐飞虱和白背飞虱生态适应性的继代影响[J]. 中国水稻科学,2016,30(2):200-209.

[3]谢小波,舒庆尧. 用Envirologix Cry1Ab/Cry1Ac试剂盒快速测定转基因水稻Bt杀虫蛋白含量的研究[J]. 中国农业科学,2001,34(5):465-468.

[4]Fiehn O,Kopka J,Trethewey R N,et al. Identification of uncommon plant metabolites based on calculation of elemental compositions using gas chromatography and quadrupole mass spectrometry[J]. Analytical Chemistry,2000,72(15):3573-3580.

[5]Milcamps A,Rabe S,Cade R,et al. Validity assessment of the detection method of maize event Bt10 through investigation of its molecular structure[J]. Journal of Agricultural&Food Chemistry,2009,57(8):3156-3163.

[6]Margarit E,Reggiardo M I,Vallejos R H,et al. Detection of Bt transgenic maize in foodstuffs[J]. Food Research International,2006,39(2):250-255.

[7]芮玉奎,羅云波,黄昆仑,等. 近红外光谱在转基因玉米检测识别中的应用[J]. 光谱学与光谱分析,2005,25(10):1581-1583.

[8]Hu Z,Yeh T F,Chang H,et al. Elucidation of the structure of cellulolytic enzyme lignin[J]. Holzforschung,2006,50(4):1040-1397.

[9]Zhou P P,Zhou R,Zhao Y F,et al. Contamination assessment of dietary ethyl carbamate in wine[J]. Chinese Journal of Food Hygiene,2008,20(3):208-209.

[10]翟亚锋,苏 谦,邬文锦,等. 基于仿生模式识别和近红外光谱的转基因小麦快速鉴别方法[J]. 光谱学与光谱分析,2010,30(4):924-928.

[11]朱文超,成 芳. 转基因水稻及其亲本叶片的可见/近红外光谱分析[J]. 光谱学与光谱分析,2012,32(2):370-373.

[12]翁时锋,张长水,张学工. 非线性降维在高维医学数据处理中的应用[J]. 清华大学学报(自然科学版),2004,44(4):485-488.

[13]吴晓婷,闫德勤. 数据降维方法分析与研究[J]. 计算机应用研究,2009,26(8):2832-2835.

[14]汪洪桥,蔡艳宁,孙富春,等. 多尺度核方法的自适应序列学习及应用[J]. 模式识别与人工智能,2011,24(1):72-81.

[15]杨国强,张淑娟,赵艳茹. 基于近红外透射光谱的汾阳王酒快速鉴别[J]. 农业机械学报,2013,44(增刊1):189-193.

[16]Capron X,Walczak B,Noord O D,et al. Selection and weighting of samples in multivariate regression model updating[J]. Chemometrics&Intelligent Laboratory Systems,2005,76(2):205-214.

[17]Kleinbaum D G,Kupper L L,Muller K E. Applied regression analysis and other multivariate models[J]. Technometrics,1978,31(1):117-118.

[18]Walczak B,Jouaimbaud D,Massart D L,et al. Comparison of multivariate calibration techniques applied to experimental NIR data sets[J]. Applied Spectroscopy,2000,54(4):608.

[19]Kompany-Zareh M,Mirzaei S. Spectrophotometric resolution of ternary mixtures of pseudoephedrine hydrochloride,dextromethorphan hydrobromide,and sodium benzoate in syrups using wavelength selection by net analyte signals calculated with hybrid linear analysis[J]. Analytica Chimica Acta,2004,526(1):83-94.

推荐访问: 亲本 光谱分析 水稻 基因 种子