Estimation of oleic acid content in Brassica napus seeds based on hyperspectral data

Rong-cai TIAN, Jun-wei LU, Chun-yun GUAN

CHINESE JOURNAL OF OIL CROP SCIENCES ›› 2022, Vol. 44 ›› Issue (1) : 190-200.

PDF(2440 KB)
Welcome to CHINESE JOURNAL OF OIL CROP SCIENCES, May. 3, 2025
PDF(2440 KB)
CHINESE JOURNAL OF OIL CROP SCIENCES ›› 2022, Vol. 44 ›› Issue (1) : 190-200. DOI: 10.19802/j.issn.1007-9084.2020281

Estimation of oleic acid content in Brassica napus seeds based on hyperspectral data

Author information +
History +

HeighLight

In order to find the most typical characteristics part of rapeseed on its oleic acid content hyperspectral estimating in Brassica napus L., 44 germplasm resources with high oleic acid content were used as materials. Spectral reflectance of seed and its oleic acid data were collected according to an order of main stem, primary branch, and secondary branch. The data were analyzed on relationship between seed oleic acid contents and original & first derivative spectral reflectance of different parts. Estimation model as stepwise multiple linear regression, partial least squares regression (PLSR), and principal component regression were established based on full wavelength and characteristic wavelength. Univariate linear regression model was established based on spectral index. And then, determination coefficient (R2), root mean square error (RMSE) and relative predicted deviation (RPD) were used to evaluate the accuracy of these models. Results showed that the PLSR model based on original spectral reflectance of the main stem had the best estimation effect in the full-wavelength model, with calibration set R2c 0.83 and RMSEc 1.63%, and validation set R2v 0.71, RMSEv 1.92%, and RPD 2.00. Among the characteristic wavelength models, PLSR model based on the first-order differential spectrum of the primary branches had the best estimation effects, with R2c 0.85 and R2v 0.87, RMSEc 1.08%, RMSEv 1.13%, and RPD 2.57. Among the estimation models constructed based on the spectra index, the RPD was less than 1.50 which prediction effect was poor. Therefore, the PLSR model based on the first derivative characteristic wavelengths might effectively estimate oleic acid content of the primary branches seeds. It also provided a sampling reference for spectral detection of oleic acid content in B. napus seeds with high oleic acid.

Cite this article

Download Citations
Rong-cai TIAN , Jun-wei LU , Chun-yun GUAN. Estimation of oleic acid content in Brassica napus seeds based on hyperspectral data[J]. CHINESE JOURNAL OF OIL CROP SCIENCES, 2022, 44(1): 190-200 https://doi.org/10.19802/j.issn.1007-9084.2020281
油酸是菜籽油脂肪酸的重要成分,高油酸菜籽油不仅营养价值高,而且稳定性好,耐贮藏[1]。因此在保持双低品质的基础上进一步提高油酸含量是油菜脂肪酸改良的热点[2]。油菜高油酸育种通常采用定向选择、杂交选育、诱变育种、基因工程及分子辅助标记选择等方法[3],但对其后代材料的筛选存在周期长、工作量大、专业性强等弊端[4],因此建立一种快速、无损、高效的油酸含量检测方法具有重要意义。
高光谱技术具有波段多、连续性强、信息量大等特点,已广泛应用于农作物品质检测[5,6]。近年来,国内外学者在应用光谱技术对油料作物脂肪酸成分检测方面进行了较多研究。Niewitetzki等[7]利用近红外光谱技术实现了每小时500粒的单粒油菜种子油酸含量检测,其模型交叉验证R2达0.96。李建国[8]利用近红外光谱技术建立了单粒花生种子油酸含量估测的PLSR模型,其建模集R2达0.91,RMSE为3.46%,且应用该模型成功选育出高油酸花生品种中花215。Parsaeian[9]将数字图像技术与多层感知人工神经网络相结合,实现了对125份不同基因型的芝麻籽的脂肪酸含量估测,其中对油酸估测R2为0.98,RMSE为0.62%。Cantarelli等[10]利用近红外漫反射光谱仪采集了100份向日葵种子光谱数据,从而建立了基于一阶微分光谱的PLSR模型,实现了对葵花籽油酸含量的快速测定。Weinstock等[11]运用近红外高光谱成像技术,实现了单粒玉米籽粒含油量和油酸含量估测,其PCA-PLSR模型预测RMSE分别为0.7%和14%。蒋蘋等[12]比较分析了PLS、PCR和RBF等3种方法在油茶内部品质检测中的效果,得出RBF效果最好,其中与油酸含量的交叉验证相关系数为0.94。郝勇[13]通过对原始光谱数据进行一阶求倒和多元散射校正的预处理,再采用变量组合集群分析降维,最终建立PLSR模型,实现了山茶油混合油品中油酸和亚油酸的快速测定。常涛[14]通过分析不同生育时期冠层光谱反射率与叶片叶绿素含量及成熟后籽粒含油量的相关关系,得出幼苗期冠层光谱反射率可进行含油量预测,实现高含油油菜种质资源的早期筛选。李施蒙[15]、吴建国[16]、高建芹[17]等应用近红外光谱法实现了油菜籽脂肪酸组分的估测。由此可知,大多数研究都是利用近红外光谱仪对油料作物的群体籽粒或单粒脂肪酸成分进行估测,应用高光谱仪器对甘蓝型油菜油酸含量检测研究较少,进行不同部位的籽粒油酸含量估测更是鲜见报道。
本研究将成熟收获后的44份高油酸甘蓝型油菜按照主茎、一次分枝、二次分枝等部位进行划分,采集不同部位的籽粒反射光谱及对应的油酸含量数据,通过相关性分析与反射光谱特征相结合的方法筛选出可用于籽粒油酸含量估测的特征波长,从而建立基于原始及一阶微分光谱反射率的全波长和特征波长的不同部位籽粒油酸含量估测的SMLR、PLSR、PCR模型,以及通过任意两波长组合构建光谱指数,建立基于光谱指数的一元线性模型,采用R2、RMSE和RPD对模型精度进行评价,以期找到用于高油酸甘蓝型油菜油酸含量估测的最佳部位,为高油酸油菜种质资源筛选提供一种低成本、快速的方法。

1 材料与方法

1.1 材料与试验设置

试验材料为湘油15号辐射诱变后代中的高油酸定向育种材料,由湖南农业大学国家油料改良中心湖南分中心提供,共44个。试验于2018年9月-2019年5月在湖南农业大学耘园基地(28°10′ N,113°4′ E,海拔44.9 m)进行,采用完全随机布置试验,小区面积1.8 m × 5 m,株行距15 cm × 25 cm。2018年9月24日播种(穴直播,田间成苗后,每穴留单株),2019年5月8日收获,施肥量为525 kg /hm2(复合肥15-15-15),其它管理同当地丰产田。

1.2 数据采集

1.2.1 籽粒样品采集

44个小区各选择3株长势一致,且具体代表性的植株地上部分,平铺于室内阴凉通风处,自然风干2个月。按照主茎、一次分枝、二次分枝,脱粒、过筛、除杂。

1.2.2 光谱数据采集

使用LAMP Pro 50 W主动光源,光源垂直于置物台正上方,垂直距离15 cm,探头向下与垂直方向呈30°夹角,与置物台中心距离9 cm。籽粒样品铺满于直径4 cm、高1 cm的托盘内。采用美国ASD FieldSpec 3地物波谱仪进行数据采集。光谱范围为350~2500 nm,光谱分辨率为3 nm @ 350~100 nm;10 nm @ 1000~2500 nm。首次使用热机 15 min并进行优化与白板定标,测试每个样品前重新白板定标。每次测量均重新混合取样,重复测量5次,记录光谱反射率的平均值。

1.2.3 籽粒油酸含量测定

采用美国Agilent GC-MS 7980B气相色谱分析脂肪酸组成。脂肪酸测定方法按照GB/T17376-2008标准,取0.02 g样品于2 mL EP管中,磨碎,加入0.4 mol/L KOH-甲醇溶液400 μL和乙醚石油醚1:1混液800 μL,萃取4 h,加蒸馏水分层(静置30 min或高速离心1 min),取上清100 μL,加乙醚石油醚混液稀释至600 μL。色谱条件:以氮气为载气,HP-5毛细管柱(30 m × 320 μm × 0.25 μm),恒流流速6.5 mL/mim,进样口温度250℃,检测器温度330℃;升温程序:初始温度为40℃,保存0.1 min,以720℃/min升至350 ℃保持2 min,再以100℃/min降至250℃保持10 min。分流比为30:1,进样体积1.0 μL。

1.3 方法

1.3.1 光谱指数选择

根据油菜光谱特征及其前人的研究成果[18~20],选取3个常用的光谱指数用于油菜籽粒油酸含量的估算,具体计算公式见表1
Table 1 Spectral index calculation formula

表1 光谱指数的计算公式

光谱指数 Spectral index 名称 Name 公式 Formula
NDSI 归一化差值光谱指数 Normalized difference spectral index Rλ1-Rλ2/Rλ1+Rλ2
DSI 差值光谱指数 Difference spectral index Rλ1-Rλ2
RSI 比值光谱指数 Ratio spectral index Rλ1/Rλ2
注: Rλ1 Rλ2表示波长在 λ1 λ2处的光谱反射率
Note: Rλ1and Rλ2indicates the spectral reflectance of the wavelength of λ1 and λ2

1.3.2 模型构建及评价

首先利用ViewSpec Pro 6.2软件对各分枝原始光谱数据进行平均及一阶微分计算并导出,然后进行主茎、一次分枝、二次分枝的原始及一阶微分光谱数据与其对应的籽粒油酸含量的相关性分析,再根据Rc选取 β-coefficient绝对值高的波长及各分枝反射光谱峰谷特征相结合的方式,筛选出特征波长,最后利用Unscrambler 10.4软件建立基于全波长和特征波长的SMLR、PLSR、PCR模型,并用OriginPro 9.1软件进行绘图。任意两波长组合构建的DSI、NDSI和RSI,基于最佳光谱指数的单变量估测模型,利用R语言编程并绘图。采用R2、RMSE和RPD对模型精度进行验证与评价。R2越接近1,RMSE越小,表明模型预测精度越高。RPD通过衡量预测值与实测值之间的偏差程度来表明模型的预测能力。通常认为RPD<1.5,不具备预测能力;1.5<RPD<2,预测能力可接受;RPD>2,预测能力极好[21]。R2、RMSE和RPD[22]的计算公式如下:
R2=1-i=1nyi-ŷi/n-p-1i=1nyi-ŷi2/n-1
RMSE=i=1n(yi-ŷi)2n
RPD=SDRMSE×nn-1
式中, yi为实测值, ŷi为预测值, SD为验证集标准差, n为样本数, p为自由度。

2 结果与分析

2.1 不同分枝油酸含量

将44个高油酸甘蓝型油菜材料,按照主茎、一次分枝、二次分枝测定其籽粒油酸含量,对测得的结果进行升序排序,再按照隔二选一的方式划分校正集和验证集,结果如表2。由表2可知,高油酸甘蓝型油菜主茎油酸含量范围为72.99~87.6,平均含量为83.72±3.64,一次分枝油酸含量范围为74.34~87.52,平均含量为84.2±2.91,二次分枝油酸含量范围为74.11~87.37,平均含量为83.49±3.04,说明选用的高油酸材料油酸含量涵盖范围较宽,具有一定的代表性。按照2∶1划分校正集和验证集,各部位校正集样本数为30,验证集样本数为14,且由表可知,验证集样本油酸范围基本位于校正集样本油酸含量之内,可用于校正集模型精度的外部验证。
Table 2 Oleic acid content in different parts of B. napus seeds

表2 甘蓝型油菜不同部位的籽粒油酸含量

组别 Groups 部位 Parts

样本数

Number of samples

最小值Min /%

最大值

Max/%

均值

Mean/%

标准差

Standard deviation/%

变异系数

CV/%

校正集

Calibration set

主茎 Main stem 30 72.99 87.60 83.76 3.94 4.70
一次分枝 Primary branches 30 74.34 87.52 84.34 2.75 3.26
二次分枝 Secondary branches 30 74.96 87.37 83.48 2.98 3.57

验证集

Validation set

主茎 Main stem 14 75.02 87.00 83.68 3.33 4.22
一次分枝 Primary branches 14 76.51 87.40 84.06 3.06 3.64
二次分枝 Secondary branches 14 74.11 86.80 83.49 3.09 3.70

2.2 油菜不同分枝籽粒反射光谱特征

高油酸甘蓝型油菜主茎、一次分枝、二次分枝籽粒油酸含量最大值和最小值对应的原始及一阶微分光谱反射率曲线如图1。由图1A、B、C可知,甘蓝型油菜主茎、一次分枝、二次分枝反射率曲线具有相同的变化趋势,呈现显著的“双峰”特征,即在1119 nm、1305 nm附近出现反射高峰,在1209 nm附近呈吸收谷,但不同部位的籽粒反射光谱也有所不同,具体表现为主茎和一次分枝油酸含量最大值对应的反射率高于最小值对应的反射率,而二次分枝相反,总体看来,三个部位在529~1132 nm、1240~1354 nm、1434~1687 nm、1775~1894 nm和1938~2258 nm等波段范围内反射强度存在差异。对原始光谱进行一阶微分变换能提高数据的信噪比,显示更多的信息,由图1D、E、F可知,各部位一阶微分光谱最大值和最小值差异较小,但经过一阶微分变换后,不同部位油菜籽粒反射光谱的峰与谷数量显著增多,共出现14个反射峰,分别在688 nm、938 nm、1058 nm、1225 nm、1396 nm、1543 nm、1597 nm、1734 nm、1770 nm、1989 nm、2071 nm、2192 nm、2316 nm、2355 nm等波长附近,共出现12个吸收谷,分别在912 nm、1156 nm、1184 nm、1382 nm、1407 nm、1566 nm、1688 nm、1752 nm、1894 nm、2043 nm、2251 nm、2338 nm等波长附近。由于1450 nm和1950 nm两波长对水强吸收,因此在后续的特征波长筛选中剔除1450 nm和1950 nm附近的吸收峰。
Fig. 1 Original and first derivative spectral reflectance curves corresponding to the maximum and minimum oleic acid content in B. napus seeds from different parts
Note: A-C and D-F indicate original and first derivative spectral reflectance respectively; A and D: main stem; B and E: primary branches;C and F: secondary branches

图1 甘蓝型油菜不同部位的油酸含量最大和最小值对应的原始及一阶微分光谱反射率曲线

注:A~C、D~F分别代表原始光谱、一阶微分光谱;A、D分别代表主茎,B、E分别代表一次分枝,C、F分别代表二次分枝

Full size|PPT slide

2.3 光谱反射率与籽粒油酸含量相关分析

将高油酸甘蓝型油菜主茎、一次分枝、二次分枝的原始及一阶微分光谱反射率数据分别与其对应的籽粒油酸含量进行相关性分析,结果如图2。由图2A可知,主茎和一次分枝在大部分波段与籽粒油酸含量呈正相关关系,其中主茎在629~894 nm和1437~1684 nm两波段呈极显著正相关,一次分枝在495~1018 nm波段达极显著正相关,二次分枝在350~1176 nm波段呈正相关,1176 nm之后变为负相关,且在1651~2487 nm波段达极显著负相关。主茎、一次分枝、二次分枝原始光谱最大相关系数分别位于1583 nm(r=0.54)、723 nm(r=0.7)和2381 nm(r=-0.74)附近。由图2B可知,一阶微分光谱与籽粒油酸含量的相关系数在部分波段略高于原始光谱,但相关系数变异性较大,相关系数不稳定,主茎、一次分枝、二次分枝在498~1945 nm波段范围内相关系数较稳定,其中主茎、一次分枝和二次分枝的最大相关系数分别位于1715 nm(r=-0.79)、1734(r=0.76)和924 nm(r=-0.73)波长处。
Fig. 2 Correlation coefficients between original and first derivative spectral reflectance and oleic acid content in B. napus seeds from different parts
Note: A and B indicate original and first derivative spectral reflectance respectively

图2 甘蓝型油菜不同部位籽粒原始及一阶微分光谱与油酸含量相关系数

注:A、B分别代表原始光谱、一阶微分光谱

Full size|PPT slide

2.4 基于光谱特征的籽粒油酸含量估测

2.4.1 全波长估测模型的建立

利用主茎、一次分枝和二次分枝的原始、一阶微分光谱数据和对应油菜籽粒油酸含量数据,建立基于全波长的SMLR、PLSR和PCR的籽粒油酸含量估测模型,并用验证集数据对估测模型精度进行外部检验,建模结果如表3所示。由表3可知,在基于原始光谱建立的模型中,主茎、一次分枝和二次分枝均以PLSR模型估测效果最理想,尤以对主花序角果籽粒估测精度最高,R2 C、R2 V分别达0.83和0.71,RMSEC和RMSEV分别为1.63%、1.92%。在一阶微分光谱建立的模型中,则以SMLR估测效果较理想,虽然在主茎和一次分枝的PLSR模型中,建模集R2达0.93和0.95,但是用剩余材料验证效果不理想,R2仅为0.56和0.37,远低于建模R2,这可能是对数据过拟合所致。对比三种建模方法,发现PCR模型效果最差,表现为R2 C最低,RMSEC最高,其主要原因可能是PCR只分解光谱阵,没有充分考虑光谱阵与浓度阵的关系[23]。综合来看,在基于全波长的估测模型中,以主茎的PLSR模型对籽粒油酸含量估测效果最好,RPD为2.00,说明模型的估测能力可接受。
Table 3 Estimation of oleic acid content in B. napus seeds based on full wavelength

表3 基于全波长的甘蓝型油菜籽粒油酸含量估测

光谱 Spectrum 部位 Parts 方法 Methods R2 C RMSEC/% R2 V RMSEV /% RPD
原始 Original

主茎

Main stem

SMLR 0.84 1.74 0.56 3.82 1.01
PLSR 0.83 1.63 0.71 1.92 2.00
PCR 0.67 2.28 0.35 2.87 1.22
一次分枝 Primary branches SMLR 0.65 1.76 0.53 2.77 0.99
PLSR 0.76 1.35 0.54 2.09 1.11
PCR 0.68 1.56 0.37 2.44 1.05
二次分枝 Secondary branches SMLR 0.85 1.28 0.47 3.19 0.82
PLSR 0.85 1.15 0.78 1.45 1.92
PCR 0.58 1.93 0.45 2.28 1.11
一阶 First derivative

主茎

Main stem

SMLR 0.88 1.52 0.77 2.76 1.27
PLSR 0.93 1.04 0.56 2.35 1.59
PCR 0.66 2.30 0.13 3.31 1.03
一次分枝 Primary branches SMLR 0.87 0.98 0.55 2.45 1.29
PLSR 0.95 0.57 0.37 2.78 1.02
PCR 0.47 1.82 0.35 2.82 1.05
二次分枝 Secondary branches SMLR 0.9 1.01 0.77 2.08 1.51
PLSR 0.88 1.03 0.61 1.93 1.34
PCR 0.68 1.68 0.44 2.31 1.06
注:SMLR、PLSR、PCR和RPD分别是逐步多元线性回归、偏最小二乘回归、主成分回归和相对预测偏差;下同
Note: SMLR: stepwise multiple linear regression, PLSR: partial least squares regression; PCR: principal component regression; RPD: relative prediction deviation. Same as below

2.4.2 基于特征波长的估测模型

基于全波长的模型虽估测结果精度较高,但存在信息冗余、运算效率低、设备成本高等弊端,在实际推广应用中的价值不大,因此在大量的光谱信息中,提取少数的特征波长,建立基于特征波长的估测模型,具有更大的应用价值。结合高油酸甘蓝型油菜反射光谱的波峰、波谷特征及反射光谱与籽粒油酸含量相关系数绝对值的高低,筛选出用于高油酸甘蓝型油菜籽粒油酸含量估测的特征波长,结果见表4。由表4可知,在基于原始光谱的数据中,主茎、一次分枝、二次分枝分别筛选出5个、4个、7个特征波长,仅占全波长0.23%、0.19%、0.33%的信息量。由于光谱一阶微分变换能提高数据信噪比,显示更多的信息,因此基于一阶微分光谱筛选出的特征波长数量多于原始光谱数据,主茎、一次分枝、二次分枝特征波长数分别占全波长光谱的0.75%、0.75%、0.56%。
Table 4 Characteristic wavelengths

表4 特征波长

光谱 Spectrum 部位 Parts 特征波长 Characteristic wavelengths /nm
原始 Original 主茎 Main stem 1119、1640、1858、2019、2213
一次分枝 Primary branches 1119、1640、2020、2214
二次分枝 Secondary branches 1209、1641、1725、1760、1859、2020、2216
一阶 First derivative 主茎 Main stem 912、938、1156、1184、1225、1396、1543、1566、1688、1734、1752、1770、1894、1989、2193、2253
一次分枝 Primary branches 688、911、1058、1156、1184、1225、1382、1396、1543、1688、1734、1752、1770、2071、2191、2251
二次分枝 Secondary branches 688、912、938、1156、1184、1225、1894、1988、2042、2317、2337、2354
表4筛选出来的高油酸甘蓝型油菜主茎、一次分枝、二次分枝的原始及一阶微分特征波长与其对应的籽粒油酸含量进行SMLR、PLSR、PCR建模,并用验证集数据(n=14)对所建模型精度进行外部验证,结果见表5。基于原始特征波长数据的主茎和一次分枝油酸含量估测模型效果均不理想,而二次分枝原始特征波长的SMLR、PLSR、PCR模型效果较好,以PLSR模型估测效果最好,校正集R2为0.67,RMSE为1.71%,验证集R2为0.61,RMSE为1.93%,RPD为1.37,仅用全波长0.33%的信息量达全波长模型78.21%的效果,这可能是主茎和一次分枝油酸含量光谱估测建模时,入选的特征波长数少于二次分枝,且波长的相关系数没有二次分枝高,因为二次分枝的原始特征波长均与籽粒油酸含量达极显著相关关系。在基于一阶微分特征波长光谱建立的估测模型中,虽然主茎的SMLR、PLSR、PCR模型具有较高的建模集R2,分别为0.71、0.84、0.73,但验证集效果不理想,这可能是由于主茎16个特征波长中,仅10个与籽粒油酸含量达极显著相关,模型过拟合所致;一次分枝的PLSR模型估测效果较优,R2 C、R2 V达0.85、0.87,RMSEC、RMSEV分别为1.08%、1.13%,这可能是因为PLSR模型能同时对光谱阵和浓度阵进行分解,有利于提高模型精度[24],同时建模所用的16个特征波长中有13个与籽粒油酸含量达极显著相关;二次分枝的三种模型效果均不理想,模型RPD为1,不具备预测能力。总体看来,在基于一阶微分特征波长的模型中,对一次分枝籽粒油酸含量的PLSR模型估测效果最优,模型RPD为2.57,具有极好的预测能力。
Table 5 Estimation of oleic acid content in different parts of B.napus seeds based on characteristic wavelengths

表5 基于特征波长的甘蓝型油菜不同部位籽粒油酸含量估测

光谱 Spectrum 部位 Parts 方法 Methods R2 C RMSEC/% R2 V RMSEV/% RPD

原始

Original

主茎

Main stem

SMLR 0.44 3.11 0.49 4.11 0.86
PLSR 0.25 3.40 NA 4.33 0.71
PCR 0.24 3.42 NA 4.30 0.71
一次分枝 Primary branches SMLR 0.31 2.40 0.25 3.48 0.72
PLSR 0.20 2.47 NA 3.23 0.73
PCR 0.19 2.47 NA 3.23 0.73
二次分枝 Secondary branches SMLR 0.59 2.00 0.79 2.00 1.28
PLSR 0.67 1.71 0.61 1.93 1.37
PCR 0.67 1.71 0.61 1.93 1.36

一阶

First derivative

主茎

Main stem

SMLR 0.71 2.26 0.59 3.68 0.98
PLSR 0.84 1.58 0.51 2.49 1.43
PCR 0.73 2.06 0.48 2.56 1.49
一次分枝 Primary branches SMLR 0.64 1.73 0.57 2.63 1.01
PLSR 0.85 1.08 0.87 1.13 2.57
PCR 0.46 2.02 0.37 2.43 1.12
二次分枝 Secondary branches SMLR 0.63 1.92 0.59 2.80 0.89
PLSR 0.45 2.20 0.47 2.25 1.07
PCR 0.57 1.96 0.45 2.28 1.07
注:NA表示数值低于0.01
Note: NA indicates the value below 0.01

2.5 基于光谱指数的单变量估测模型

图3为高油酸甘蓝型油菜不同部位籽粒原始光谱反射率任意两波长进行组合后的光谱指数(DSI、NDSI、RSI)与其对应的籽粒油酸含量进行相关分析所得决定系数图,由图可知,NDSI和RSI与籽粒油酸含量的相关性在主茎、一次分枝、二次分枝等3个不同部位中具有相似性,即决定系数R2高的归一化组合其比值组合R2也高。且决定系数大的波长组合以近红外区域居多,说明近红外区域波长在进行籽粒油酸含量估测时的表现较好。
Fig. 3 Determination coefficient of spectral index constructed by any two wavelengths and content of oleic acid in B. napus seeds

图3 甘蓝型油菜任意两波长构建的光谱指数与籽粒油酸含量的决定系数

Full size|PPT slide

在任意两波长构建的光谱指数中,筛选出与籽粒油酸含量决定系数最高的波长组合,建立基于最优光谱指数的一元线性回归模型,并用验证集数据对模型精度进行外部检验,结果见表6。由表6可知,在3个部位中,利用NDSI和RSI筛选出的用于油酸含量估测的波长组合一致,分别为2117 nm和2305 nm、2254 nm和2304 nm、2199 nm和2239 nm,且两者的建模效果相当。对比不同部位的模型效果,发现对二次分枝籽粒油酸含量的估测效果较好,以DSI(2471,1726)、NDSI(2239,2199)、RSI(2199,2239)为变量构建的模型R2 C分别达0.62、0.71、0.71,RMSEC为1.84%、1.62%、1.61%,但用剩余品种验证效果不理想,验证集R2为0.4左右,RMSE为2.5%左右,RPD仅为1.1左右,但效果优于对主茎和一次分枝油酸估测的模型。在基于光谱指数的估测模型中,以DSI(1757,1701)为变量建立的一元线性模型在估测一次分枝籽粒油酸含量时的效果最优,R2c为0.69,R2v为0.57,RPD为1.35,这与程潜等[25]研究得出基于DVI建立的油酸含量估测模型达显著或极显著水平结果相近。但是基于光谱指数的估测模型中RPD均小于1.5,均不能有效地估测高油酸油菜籽粒油酸含量,这可能是由于一元线性模型过于简单,而光谱与油酸含量呈非线性关系所致。
Table 6 Estimation of oleic acid content in different parts of B.napus based on spectral index

表6 基于光谱指数的甘蓝型油菜不同部位籽粒油酸含量估测

部位Parts

光谱指数

Spectral index

估测模型

Estimation model

R2 C RMSEC /% R2 V RMSEV /% RPD

主茎

Main stem

DSI(1767,1766) y=31925+36.131 0.65 2.34 0.16 4.16 0.91
NDSI(2305,2117) y=150.5+20.642 0.67 2.25 0.27 3.6 1.06
RSI(2117,2305) y=-147.21+144.02 0.67 2.25 0.28 3.55 1.06

一次分枝

Primary branches

DSI(1757,1701) y=2225.3+46.37 0.69 1.54 0.57 2.03 1.35
NDSI(2304,2254) y=110.65+52.22 0.78 1.28 0.24 2.76 0.99
RSI(2254,2304) y=-89.977+133.87 0.79 1.28 0.24 2.75 0.99

二次分枝

Secondary branches

DSI(2471,1726) y=-290.89+105.64 0.62 1.84 0.49 2.33 1.08
NDSI(2239,2199) y=555.44+64.976 0.71 1.62 0.39 2.54 1.15
RSI(2199,2239) y=-294.64+359.14 0.71 1.61 0.39 2.54 1.16
注: x表示对应的光谱指数,y表示对应的籽粒油酸含量
Note: x: corresponding spectral index; y: corresponding content of oleic acid in seeds

2.6 模型优选与验证

通过上述分析,发现PLSR模型在估测不同部位籽粒油酸含量的效果优于SMLR、PCR和一元线性模型,尤以建立的一阶特征波长PLSR模型对一次分枝籽粒油酸含量的估测效果最优,建模集R2达0.85,RMSE为1.08%,说明该模型可有效地估测高油酸油菜籽粒油酸含量,一次分枝可作为油酸含量光谱快速无损估测的特征器官。为评价模型的稳定性及适用性,用剩余材料(n=14)对模型精度进行外部验证,图4为一次分枝籽粒油酸含量光谱估测的实测值与预测值的关系。可知,验证集R2达0.87,RMSE为1.13%,RPD为2.57,说明基于一次分枝特征波长一阶微分光谱反射率的籽粒油酸含量PLSR估测模型效果稳定且可靠性高,为高油酸甘蓝型油菜品质育种材料筛选提供借鉴方法。
Fig. 4 The 1:1 relationship between measured and predicted value of PLSR model external verification of oleic acid content in seeds

图4 籽粒油酸含量PLSR模型外部验证实测值与预测值间的1:1关系

Full size|PPT slide

3 讨论

虽然应用近红外光谱技术进行油菜脂肪酸含量检测的报道较多[26~29],但在使用近红外仪器检测油菜脂肪酸成分时,对样品的选择具有随机性、受人为因素影响大等弊端。曾宇等[30]认为在品质测定取样时如果没有考虑主茎与分枝比例,仅采用充分混匀的样本,测定结果会受影响。因此本文将油菜植株按照主茎、一次分枝、二次分枝等部位进行细分,分别测定其籽粒反射光谱及对应的籽粒油酸含量,以期找到可用于油酸含量估测的最佳部位,减轻取样工作量及样品制备的人为误差。结果显示,PLSR模型在对不同部位籽粒油酸含量估测中效果较其它模型理想,尤以基于一阶微分特征波长的PLSR模型估测一次分枝籽粒油酸含量效果最优,模型外部验证RPD为2.57,这一结论与国内外成熟的近红外光谱分析软件在进行农产品品质检测时大多采用PLS建模[31]的结果相似,但模型缺乏机理解释,因此接下来将以生育期叶片理化指标为中间量,建立“叶片光谱—叶片理化指标—一次分枝籽粒油酸含量”的关系模型,增强模型的解释性。
同时,本文的研究是基于成熟收获后的籽粒光谱,仅可达到估算油酸含量的效果,筛选时间滞后,而高建芹研究得出叶片中油酸含量蕾薹期>花期>苗期、越冬期,且营养器官中的油酸与成熟籽粒中的油酸含量成正相关[32],因此接下来将按照“生育期叶片光谱—生育期叶片油酸含量—一次分枝籽粒油酸含量”的技术路线开展试验,以期实现高油酸甘蓝型油菜新材料的生育前期筛选,缩短选育种周期,降低育种成本。虽然本文得出PLSR模型估测效果较好,但建模方法对预测模型精度影响较大[33],研究表明[34]支持向量机、随机森林、人工神经网络等机器学习算法能有效提高模型精度,故今后将从建模方法上做进一步探究,提高预测精度。

References

1
张振乾, 肖钢, 谭太龙, 等. 高油酸油菜研究进展及其前景展望[J]. 作物杂志2009(5): 1-6. DOI:10.3969/j.issn.1001-7283.2009.05.001 .
2
吴新杰, 胡宝成, 陈凤祥, 等. 甘蓝型油菜高油酸性状研究进展[J]. 作物杂志2012(2): 5-9. DOI:10.16035/j.issn.1001-7283.2012.02.009 .
3
张振乾, 胡庆一, 官春云. 高油酸油菜研究现状、存在的问题及发展建议[J]. 作物研究201630(4): 462-474. DOI:10.16848/j.cnki.issn.1001-5280.2016.04.27 .
4
卢俊玮, 田容才, 花宇辉, 等. 光谱技术在甘蓝型油菜品质检测中的研究进展[J]. 激光生物学报202029(4): 289-294, 301. DOI:10.3969/j.issn.1007-7146.2020.04.001 .
5
Fu D D Zhou J F Scaboo A. Fast measurement of fatty acid in soybean using reflective hyperspectral imaging[C]//2019 Boston, Massachusetts July 7- July 10, 2019. St. Joseph, MI: American Society of Agricultural and Biological Engineers, 2019: 1. DOI:10.13031/aim.201900386 .
6
Sun J F Wang G X Zhang H, et al. Detection of fat content in peanut kernels based on chemometrics and hyperspectral imaging technology[J]. Infrared Phys Technol2020105: 103226. DOI:10.1016/j.infrared.2020.103226 .
7
Niewitetzki O Tillmann P Heiko C,et al. 高通量分析单粒油菜种子中亚麻酸和油酸含量的近红外光谱新方法(英文)[C]//第十二届国际油菜大会论文集, 武汉: 第十二届国际油菜大会筹备委员会, 2007: 2570-2572+364.
8
李建国, 薛晓梦, 张照华, 等. 单粒花生主要脂肪酸含量近红外预测模型的建立及其应用[J]. 作物学报201945(12):1891-1898.
9
Parsaeian M Shahabi M Hassanpour H. The integration of image processing and artificial neural network to estimate four fatty acid contents of sesame oil[J]. LWT2020129: 109476. DOI:10.1016/j.lwt.2020.109476 .
10
Cantarelli M A Funes I G Marchevsky E J, et al. Determination of oleic acid in sunflower seeds by infrared spectroscopy and multivariate calibration method[J]. Talanta200980(2): 489-492. DOI:10.1016/j.talanta.2009.07.004 .
11
Weinstock B A Janni J Hagen L S, et al. Prediction of oil and oleic acid concentrations in individual corn (Zea mays L.) kernels using near-infrared reflectance hyperspectral imaging and multivariate analysis[J]. Appl Spectrosc200660(1): 9-16. DOI:10.1366/000370206775382631 .
12
蒋蘋, 罗亚辉, 胡文武, 等. 基于高光谱的油茶籽内部品质检测最优预测模型研究[J]. 农机化研究201537(7): 56-60. DOI:10.13427/j.cnki.njyi.2015.07.013 .
13
郝勇, 吴文辉, 商庆园, 等. 山茶油中油酸和亚油酸近红外光谱分析模型[J]. 光学学报201939(9): 381-386. DOI:10.3788/AOS201939.0930004 .
14
常涛, 王悦, 程潜, 等. 高光谱反射法早期快速筛选高含油量油菜种质资源[J]. 激光生物学报201827(6): 510-515. DOI:10.3969/j.issn.1007-7146.2018.06.004 .
15
李施蒙, 王耐红, 张敏, 等. 甘蓝型油菜脂肪酸组分近红外分析模型构建[J]. 广东农业科学201441(21): 16-21. DOI:10.16768/j.issn.1004-874x.2014.21.020 .
16
吴建国, 石春海, 张海珍. 构建整粒油菜籽脂肪酸成分近红外反射光谱分析模型的研究[J]. 光谱学与光谱分析200626(2): 259-262. DOI:10.3321/j.issn: 1000-0593.2006.02.017 .
17
高建芹, 张洁夫, 浦惠明, 等. 近红外光谱法在测定油菜籽含油量及脂肪酸组成中的应用[J]. 江苏农业学报200723(3): 189-195. DOI:10.3969/j.issn.1000-4440.2007.03.006 .
18
殷紫, 常庆瑞, 刘淼, 等. 基于光谱指数的不同生育期油菜叶片SPAD估测[J]. 西北农林科技大学学报(自然科学版)201745(5): 66-72. DOI:10.13207/j.cnki.jnwafu.2017.05.010 .
19
由明明, 常庆瑞, 田明璐, 等. 基于随机森林回归的油菜叶片SPAD值遥感估算[J]. 干旱地区农业研究201937(1): 74-81. DOI:10.7606/j.issn.1000-7601.2019.01.10 .
20
Wang L Chang Q R Li F L, et al. Effects of growth stage development on paddy rice leaf area index prediction models[J]. Remote Sens201911(3): 361. DOI:10.3390/rs11030361 .
21
Chang C W Laird D A. Near-infrared reflectance spectroscopic analysis of soil c and N[J]. Soil Sci2002167(2): 110-116. DOI:10.1097/00010694-200202000-00003 .
22
王玉娜, 李粉玲, 王伟东, 等. 基于连续投影算法和光谱变换的冬小麦生物量高光谱遥感估算[J]. 麦类作物学报202040(11): 1389-1398. DOI:10.7606/j.issn.1009-1041.2020.11.14 .
23
褚小立. 化学计量学方法与分子光谱分析技术[M]. 北京: 化学工业出版社, 2011.
24
于宏威, 王强, 石爱民, 等. 高光谱成像技术结合化学计量学可视化花生中蛋白质含量分布[J]. 光谱学与光谱分析201737(3): 853. DOI:10.3964/j.issn.1000-0593(2017)03-0853-06 .
25
程潜, 肖钢, 张振乾, 等. 基于高光谱的冬油菜植株种子脂肪酸成分研究[J]. 作物研究201731(3): 265-271. DOI:10.16848/j.cnki.issn.1001-5280.2017.03.11 .
26
尚国霞. 甘蓝型油菜高油酸性状的遗传研究及近红外检测模型的建立[D]. 重庆: 西南大学, 2010.
27
智文良, 信晓阳, 崔建民, 等. 一种国产近红外仪分析油菜籽三种品质参数[J]. 中国油料作物学报201234(3): 305-310.
28
鲁蒙, 秦亚平. 利用近红外光谱分析技术检测油菜主要品质性状研究[J]. 现代商贸工业201022(17): 387-388. DOI:10.19311/j.cnki.1672-3198.2010.17.246 .
29
崔虎亮, 张亚楠, 贺霞, 等. 近红外光谱技术测定油料种子脂肪酸的研究进展[J]. 中国种业2020(2): 13-18. DOI:10.19462/j.cnki.1671-895x.20200119.027 .
30
曾宇, 雷雅丽, 李京, 等. 氮、磷、钾用量与种植密度对油菜产量和品质的影响[J]. 植物营养与肥料学报201218(1): 146-153.
31
谭正林, 吴谋成, 傅廷栋. 近红外光谱技术在农产品品质检测中的应用[J]. 中国油料作物学报201234(4): 455-460.
32
高建芹, 浦惠明, 龙卫华, 等. 高油酸甘蓝型油菜油酸积累动态[J]. 中国油料作物学报201234(4): 359-365.
33
依尔夏提·阿不来提, 买买提·沙吾提, 白灯莎·买买提艾力, 等. 基于随机森林法的棉花叶片叶绿素含量估算[J]. 作物学报201945(1): 81-90. DOI:10.3724/SP.J.1006.2019.84058 .
34
Siegmann B Jarmer T. Comparison of different regression models and validation techniques for the assessment of wheat leaf area index from hyperspectral data[J]. Int J Remote Sens201536(18): 4519-4534. DOI:10.1080/01431161.2015.1084438 .
PDF(2440 KB)

1473

Accesses

0

Citation

Detail

Sections
Recommended

/