• 尊龙凯时(中国)人生就是搏!

    实验室高光谱数据在马铃薯晚疫病田间检测中的潜力
    日期:2022-03-18 12:01:37

    —— 摘要 ——



    研究人员对检测马铃薯晚疫病(Phytophthora infestans)的高光谱成像越来越感兴趣。由于在野外条件下,尤其是在疾病早期,很难获得疾病发展的准确光谱特征,以前的工作主要集中在受控条件下的实验室测量。然而,试验结果从实验室外推到田间环境被证明是困难的。本试验评估了实验室高光谱数据在马铃薯晚疫病田间检测模型中的应用。试验是从六个分离的叶盘构建了一个高光谱训练库,其中包含8585个光谱,标记为健康类别和疾病发展的五个进展阶段。经过平滑和归一化处理后,70.0%的数据接受了逻辑回归模型的训练,30.0%的数据留作验证。然后,在高和低染病压力下,对田间条件下两个马铃薯品种(对晚疫病敏感和抗性)拍摄的12幅高光谱图像进行分类。实验室数据的分类准确率为94.1%,这不足以使用实验室收集的数据集检测田间症状。当通过包含一阶导数和采用新的归一化策略改变光谱预处理时,新模型导致80.8%的较低分类准确率,在标记的实验室光谱上得到验证,但能够在田间条件下检测症状。视觉疾病评分与田间疾病模型分类结果之间的相关性得出R2值为0.985。可以得出的结论是,训练一个实验室数据模型用于田间疾病检测是可行的。


    —— 引言 ——


    作物病害仍然是马铃薯生产中的主要产量限制因素。致病疫霉菌(Phytophthora infestans (Mont.) de Bary)引起马铃薯晚疫病,是最臭名昭著的病原体之一。为了减少与该疾病相关的巨大社会经济消耗和环境成本,科学家们正在寻求精确施用农药,这需要关于整个田间作物病害状况的高质量、高分辨率数据支撑。


    本研究的目的是评估基于实验室数据训练的机器学习模型在田间疾病检测中的适用性。实现这一目的的目标是:(a)基于实验室测量构建标记的高光谱训练库,(b)基于该数据集训练机器学习疾病检测模型;(c)在野外条件下拍摄的全新、未标记的高光谱图像上验证该模型(d)实施替代特征选择和预处理,以提高模型在野外疾病检测中的性能。


    —— 材料和方法 ——


    实验室测量


    图1显示了实验室条件下高光谱测量的实验装置。一台推扫式高光谱相机,能够在400-1000 nm光谱范围内测量224个波段的反射率(FX10e相机,芬兰,奥卢),相机放置在一个带有透明盖子的保护性塑料盒内。传感器的位置应与移动方向垂直,从天顶的角度直接向下测量。传感器盒两侧安装了两个500 W卤钨灯,为高光谱相机提供额外照明。


    从Bintje品种的不同马铃薯植株上收获六片分离的叶片,使用钉书钉(不刺穿植物组织)将其连接到泡沫塑料托盘上。其中三片叶子接种了一种致病疫霉菌孢子溶液(isolate EU36),另外三片作为对照。这些托盘在100.0%湿度和19°C温度下培养3天,然后将每个托盘放在传送带上对叶片进行高光谱扫描。


    病原体在3天后达到活体营养阶段,可见病变刚刚开始形成,但没有坏死营养或孢子形成。在理想条件下,这个阶段距离新孢子形成大概有1-4天。此时,叶片相对较大面积没有受到影响。在每次测量之前,获取白色参考扫描(100.0%反射率瓷砖)和暗参考值(通过关闭相机快门实现)。白色参考用于补偿照明条件的变化,而暗参考用于补偿传感器的背景信号。


    图1220317s.jpg

    图1 实验室条件下用于离体叶片实验的高光谱传感器实验装置


    田间测量


    田间数据在位于比利时Kruishoutem的跨省马铃薯栽培研究中心(PCA)/国际马铃薯栽培研究中心进行收集,遵循Appeltans等人(Appeltans et al., 2020)描述的方法。使用一个长为3m的可移动铝制测量架从研究中心的致病疫霉菌品种试验中进行了 12 次扫描。测量架位于作物上方,测量高度为作物冠层上方300mm。扫描是通过使用电动机和传动带将移动到作物冠层上进行的,使用与实验室测量相同的方法进行白色和暗参考测量。这些扫描对应于两个马铃薯品种:Agria,抗晚疫病品种;Fontane,易感晚疫病品种。


    对于每个品种,在晚熟生长阶段选择感染程度高和低的地块,然后于2020年7月30日在每个地块的三个位置进行扫描,四个地块总共进行12次扫描(表1)。表1显示了四个测量地块中每个地块的叶面积感染百分比。注意,Agria-A的叶面积感染率在2020年7月20日时为2.5%,而Agria-B为32.5%,但在7月30日测量时它们是相同的。值得注意的是,测量是在盛夏进行的,平均最高气温为30°C,几乎没有降水,这会使受感染的叶片迅速干燥,并限制感染的传播。


    表1 2020年测量的田间小区中感染叶面积的百分比

    表1220317.jpg

    四个地块各进行三次扫描,其中两个是Agria品种(Agria-A和Agria-B),两个是Fontane品种(Fontane-A和Fontane-B)。附录'-A'和'-B'分别对应于较低的感染和较高的感染


    高光谱库


    训练数据集是通过选择一个感兴趣的区域获得的,该区域覆盖一片叶子的7张小叶,包含健康和染病组织。高光谱训练数据集的光谱属于健康和染病组织,根据近红外区域的反射率情况在疾病进展过程中自动标记,“健康”对应于高光谱库中的668 nm波段的反射率介于0和0.17之间;疾病分五个阶段,第一阶段0.17-0.19,第二阶段0.19-.21,第三阶段0.21-0.23,第四阶段0.23-0.25,第五阶段高于0.25。这个过程产生了8585个光谱的训练库。对应于健康和疾病五个阶段的每个训练集占整个训练集的百分比分别为86.2%、4.7%、3.3%、2.00%、2.1%和1.7%。


    建模


    图2显示了用于实现实验室疾病检测模型和田间疾病检测模型的建模过程。实验室疾病检测模型是一种经过微调的模型,用于在实验室条件下拍摄的高光谱图像上检测疾病。对田间疾病检测模型进行了微调,以便在田间条件下拍摄的高光谱图像上检测症状。两个模型都在实验室条件下采集的同一数据集上进行训练。第一个预处理步骤是使用白色参考值和暗参考值校正实验室原始光谱数据。然后,去除411nm以下和990nm以上的谱带,因为它们含有太多的噪声。503 nm及以下波段附近的噪声和反射轻微升高是由于接种用蓝色聚苯乙烯泡沫塑料托盘产生的高“蓝色”反射。使用scikit-learn软件包中的Savitzky-Golay平滑函数对数据进行平滑,然后通过将光谱除以850和900 nm之间的平均反射率进行归一化。


    图2220317s.jpg

    图2 疾病检测建模图,显示最终工作流程以及实现此最终工作流程所需的步骤


    使用scikit-learn Python软件包的train_test_split算法将该数据集分开,70.0%(6006个光谱)用于训练,30.0%(2579个光谱)用于模型验证。这70.0%用于使用scikit-learn Python软件包的LogisticRegressionCV函数来训练逻辑回归模型,从而产生一个有监督的机器学习分类器,该分类器能够将每个图像像素分为六个类别之一:健康、阶段1、阶段2、阶段3、阶段4和阶段5。LogisticRegressionCV函数有12个可能的C参数值作为输入(0.1,0.5,1,1.5,2,4,10,15,20,30,50,100),算法从中自动选择最佳C值。在这种情况下,算法保留了10的C值。这个经过训练的模型被称为实验室疾病检测模型。


    使用实验室模型对实验室数据进行分类后,进行模型调整使模型更适合田间数据的分类。从现在起,这种新的、经过调整的模型被称为“田间疾病检测模型”。为了开发这种田间疾病检测模型,通过将光谱除以850-900 nm的平均反射率进行归一化,并进行Savitzky-Golay平滑,计算一阶导数以消除阴影效应。测试了一系列波段组合、植被指数、特征选择和光谱预处理步骤(包括1-3阶导数)。一阶导数被证明是消除阴影影响的唯一可行的预处理策略。因此,最终模型在第一次推导后使用了整个光谱范围。


    —— 结果 ——


    这项工作的主要结果是发现,基于实验室尺度的训练数据集,可以训练一种机器学习算法来检测田间下的晚疫病症状。然而,建模过程并不简单,需要进行修改,使最终模型仅在田间条件下可用(但不再在实验室条件下可用)。


    图3显示了马铃薯晚疫病菌感染期间(归一化和平滑后)高光谱轮廓的发展。图3A显示了健康马铃薯组织的光谱轮廓。在680 nm处,叶绿素吸收导致反射率的典型下降是显而易见的。红边区域(700到780 nm之间)的形状非常清晰,在从可见光区域到近红外区域的过渡过程中,反射率急剧上升。在可见光区域,绿色波段(近550nm)的高反射率清晰可见。图3B显示了马铃薯晚疫病病变的光谱轮廓。红边区域的形状更不明确,呈现出更为平缓的倾斜。与正常光谱相比,绿色区域的反射率降低。图3C显示了马铃薯晚疫病病变的横截面相对应的光谱。在这里,可以看到光谱特征从健康组织到疾病组织的转变。比较图3A-C中不同感染阶段的光谱,可见光区域的反射率在绿色区域降低,在红色和蓝色区域增加,在近红外区域增加,这表明随着晚疫病病变的发展,875 nm之前的反射率值降低,875 nm之后的反射率增加。


    图4更为明显和详细地描述了这一发展,图4描绘了本研究中开发的马铃薯晚疫病预测模型的每个类别训练集的光谱。通过计算混淆矩阵来评估建模精度和分类错误。实验室模型实现了94.1%的建模精度,在更改模型特征以用于田间疾病检测后,该精度降至80.8%。


    图5显示了在高光谱库上训练的实验室逻辑回归疾病检测模型的混淆矩阵。由于训练数据是从单个感兴趣的区域中选择的,然后自动标记,因此相对较多的训练样本对应于“健康”类。在评估整体模型准确性时,这一点很重要,因为可能存在对健康标签分类的偏见。然而,从混淆矩阵来看,很明显,无论类别如何,几乎没有错误分类。


    图3220317s.jpg

    图3 疾病进展过程中高光谱特征的发展。A健康马铃薯组织的高光谱特征,B马铃薯晚疫病病变的高光谱特征,C马铃薯晚疫病病变横截面像素对应的高光谱曲线

    图4220317s.jpg

    图4 高光谱训练库中每个疾病进展等级的马铃薯叶片光谱图,平均光谱以粗体显示。

    图5220317.jpg

    图5 根据全谱实验室数据训练的逻辑回归疾病检测模型对应的混淆矩阵。阶段1至5代表基于668 nm波段的侵染性支原体疾病进展阶段


    表2 从混淆矩阵得出的感染性支原体实验室疾病检测模型的诊断(以比率给出)

    表2220317.jpg

    TPR真阳性率、TNR真阴性率、PPV精密度/阳性预测值、NPV阴性预测值、FPR假阳性率、FNR假阴性率、FDR假发现率、ACC准确度


    实验室模型的整体模型精度为94.1%。表2显示了从混淆矩阵(图5)得出的每类实验室疾病检测模型的诊断结果。每个类别的检测准确率为95.0%或更高。第2阶段和第3阶段的假阴性率(FNR)最高,分别为15.0%和12.0%,表明这一数量的群体被错误分类。注意,错误分类是模型错误标记特定光谱的结果。


    为了进一步评估分类性能,通过对用于高光谱库建设的高光谱图像的每个像素进行分类来生成分类图像。研究并检查了该图是否存在异常,还研究了疾病在整个叶片中的传播。图6显示了实验室模型对蓝色泡沫塑料托盘的高光谱图像进行的分类,托盘中含有接种了马铃薯晚疫病菌的马铃薯植株的分离叶片。图6A显示了完全分类的图像,而图6B显示了单个感染性疟原虫病变的特写。图6C显示了分离叶片托盘的正常RGB图像,仅叠加了阶段1和阶段2像素。图6D显示了病变的特写RGB图像,再次与1期和2期疾病像素叠加,以可视化高光谱相机检测到的病变(1至5期)覆盖的区域大于RGB图像中肉眼可见的深棕色斑点。


    为了评估在实验室条件下训练的疾病检测模型在野外条件下的性能,为野外条件下测量的所有高光谱图像构建了分类图像,通过检查田间高光谱图像上可见的晚疫病症状分类来评估模型性能。图7显示了在野外条件下测量的12幅高光谱图像的代表性图像的logistic回归实验室疾病检测模型分类(表1)。图7A显示了从高光谱数据立方体中获取的RGB图像。请注意,RGB图像中的白色区域代表土壤像素,由于这些区域的低反射率和大量噪声,这些像素看起来很亮。在归一化步骤中,该低反射率被转换为高反射率(未显示数据)。尽管视觉疾病评估(表1)证实了症状的存在,但实验室模型并未成功识别疾病。


    图6220317s.jpg

    图6 实验室条件下,在感染马铃薯晚疫病菌3天后测量的托盘分离马铃薯叶片的高光谱图像分类。A分类图像,B感染支原体病变特写,C阶段1和阶段2叠加在超立方体的正常RGB图像上,显示可见的深棕色病变,周围有疾病检测模型分类的红色和黄色区域

    图7220317s.jpg

    图7 使用实验室检测模型对田间采集的12次扫描的代表性高光谱图像进行分类。A为RGB图像,B分类图像


    在调整建模和预处理策略以开发田间疾病检测模型后,再次生成田间扫描的分类图像,以重新评估模型性能。图8显示了在野外条件下进行的12次扫描的代表性高光谱图像(表1),按照改进的田间疾病检测模型进行分类。田间疾病检测模型的分类精度降低(从94.1%降至80.8%),但提高了田间测量的分类性能。图8A显示了从超立方体导出的RGB图像。图8B显示了分类结果。很难区分第一阶段、第三阶段和第五阶段之间的疾病,但第四阶段的分类似乎准确地涵盖了田间视觉上存在的症状。


    结果表明,尽管调整后的疾病检测模型在田间条件下表现合理(图8),但它无法对原始实验室数据集进行分类(图9)。图9显示了通过田间疾病检测模型对离体叶片数据集(在实验室获得)的分类。


    为了表明该模型在田间条件下绘制疾病图谱的有效性,由训练有素的技术人员将分类图像与传统的视觉评分进行比较。图10将田间疾病检测模型的分类与田间技术人员确定的疾病评分进行了比较。技术人员的结果与方程式1的模型结果之间存在线性回归,R2值为0.985


    y = 0.7894x − 1.8175      (方程式1)


    y为模型结果,x为技术人员的结果。这表明技术人员获得的结果高估了作物的病害严重程度,或者模型低估了病害严重程度。注意,由于仅包括4个图(对应于12个高光谱图像),且只有3个不同的疾病严重程度,该R2值仅指示模型输出和视觉评分结果之间的相关性,还需要进一步确认。

     

    图8220317s.jpg

    图8 使用田间采集的12次扫描的代表性高光谱图像的经调整的田间逻辑回归检测模型对高光谱图像进行分类。A超立方体获得的RGB图像,B分类图像

    图9220317s.jpg

    图9 使用改进的田间逻辑回归疾病检测模型对实验室数据进行分类。A分离的土豆叶的托盘,B病损特写

    图10220317s.jpg

    图10 技术人员和田间疾病检测模型测量的四个地块的平均疾病严重程度的比较。


    —— 结论 ——


    当前工作的结果强调了利用实验室数据训练马铃薯晚疫病菌田间疾病检测模型的困难性。期间开发了两个模型,一个模型能够对实验室数据进行分类,准确率为94.1%,但无法对田间条件下拍摄的图像进行分类,另一个模型经过调整,在田间条件下表现更好,但准确率降低了80.8%,并高估了实验室扫描的症状。经过实验室训练的模型在实验室数据方面表现良好,能够在实验室检测到早期的、可见的症状。然而,该模型无法对田间数据进行分类。经过调整的田间检测模型(也根据实验室数据进行了训练)能够在田间条件下对感染后期进行分类,但在实验室数据上表现不佳,突出了两种数据类型之间的差异。可以得出结论,根据实验室数据开发一个在一定程度上适用于田间条件的模型是困难的,但并非不可能。作者建议考虑创建一个高光谱训练库,将田间数据或至少温室和实验室数据融合在一起。这种混合模型结合了实验室条件下收集早期疾病发展信息的优势,以及获得田间数据的噪声和干扰因素信息的优势。



    原文信息:

    Appeltans, S., Pieters, J.G. & Mouazen, A.M. Potential of laboratory hyperspectral data for in-field detection of Phytophthora infestans on potato. Precision Agriculture, 2021: 1-18.


    扩展阅读:

    多光谱成像在油菜叶斑病症状前早期检测中的应用

    •光谱成像检测葡萄枝干疾病Esca叶片症状的可行性

    •叶绿素荧光成像在番茄幼苗冷害检测中的应用

    •基于多光谱传感器的叶片灰霉病症状前早期检测

    收 藏
    友情链接: