基于融合高光谱与纹理特征的机器学习模型估算水稻产量相关性状
图7皮尔逊相关系数法、连续投影算法、竞争性自适应重加权采样法三种降维方法结合机器学习算法,对叶片氮浓度(A–C)、叶面积指数(D–F)、地上生物量(H–J)、籽粒产量(K–M)构建的最优性能模型验证结果LNC、LAI、AGB、GY 分别为叶片氮浓度、叶面积指数、地上生物量、籽粒产量;图8最优组合模型引入纹理特征后对叶片氮浓度(A)、叶面积指数(B)、地上生物量(C)、籽粒产量(D)的估算结果LNC
Estimating rice yield-related traits using machine learning models integrating hyperspectral
and texture features
研究单位:广东农业科学院水稻研究所;华南农业大学
摘要:
背景:在现代表型组学研究中,无损、高精度且同步快速估算多项性状指标,是实现精准诊断的重要手段。通过“光谱数据+纹理数据+降维处理+机器学习”的技术策略,提升水稻产量相关性状指标(叶片氮浓度LNC、叶面积指数LAI、地上生物量AGB、籽粒产量GY)估算模型的精度,具有重要研究价值。
方法:2022—2023年,同步采集水稻冠层高光谱影像及LNC、LAI、AGB、GY的实测数据;对预处理后的光谱数据分别采用皮尔逊相关系数法、连续投影算法(SPA)、竞争性自适应重加权采样法(CARS) 进行降维处理,筛选敏感波长;基于人工神经网络(ANN)、支持向量机回归、一维卷积神经网络、长短期记忆网络构建基础估算模型;提取敏感波长对应的纹理特征,结合“光谱数据+纹理数据+降维处理+机器学习”的方法,构建高精度估算模型。
结果:SPA-ANN组合模型对LNC(决定系数R2=0.82,均方根误差RMSE=3.68 g/kg)和LAI(R2=0.75,RMSE=0.47)的预测效果最优;CARS-ANN组合模型对AGB(R2=0.90,RMSE=79.05 g/m²)和GY(R2=0.63,RMSE=0.59 t/ha)的预测效果最优。添加纹理特征后,模型R2最大提升9.9%,RMSE最大降低27.2%。
结论:本研究优化的技术方法可显著提升水稻产量相关性状估算模型的精度,研究结果为水稻产量相关性状的精准诊断提供了科学依据与技术数据支撑。
数据采集:
本研究采用搭载 X20P 机载高光谱成像仪的中国大疆 M300 RTK 多旋翼无人机,采集水稻冠层高光谱数据。该成像仪的光谱探测范围为 350~1000 nm,光谱分辨率 4 nm,有效波段数 164 个;无人机飞行高度设为 50 m,数据采集时间为北京时间 10:00—14:00,且均在晴天条件下完成。

图1 V1、V2 分别代表水稻品种 “美香占 2 号” 和 “南晶香占”;N0、N1、N2、N3、N4 分别代表施氮量处理,施氮水平依次为 0、60、120、180、240 千克 / 公顷
研究方法:
表1 水稻不同生育期产量相关性状实测值统计


图2 PCC、SPA、CARS 分别为皮尔逊相关系数法、连续投影算法、竞争性自适应重加权采样法;ANN、SVR、一维 CNN、LSTM 分别为人工神经网络、支持向量回归、一维卷积神经网络、长短期记忆网络;PI、HD 分别为幼穗分化期、抽穗期。

图3 美香占 2 号(A、C、E、G)和南晶香占(B、D、F、H)在不同生育期的 SG 平滑冠层光谱反射率。为排除 X20P 传感器光谱两端(900 nm 以上区域尤为明显)的噪声区间,本次展示的光谱范围限定为 400~900 nm,确保用于分析的有效光谱数据呈现清晰。

图4 不同施氮水平对美香占 2 号(A、C、E、G)和南晶香占(B、D、F、H)不同生育期叶片氮浓度、叶面积指数、地上生物量及产量的影响。2022 年早季抽穗期(2022 E HD)、2022 年晚季幼穗分化初期(2022 L PI)、2022 年晚季抽穗期(2022 L HD)、2023 年早季幼穗分化初期(2023 E PI)分别为对应生育期;N0、N1、N2、N3、N4 分别代表施氮量 0、60、120、180、240 千克 / 公顷处理;同一生育期不同施氮水平下的小写字母,表示在p<0.05 水平上存在显著性差异。

图5 水稻不同生育期叶片氮浓度(A)、叶面积指数(B)、地上生物量(C)与产量的相关性,以及叶片氮浓度与叶面积指数(D)、叶片氮浓度与地上生物量(E)、叶面积指数与地上生物量(F)的相关性。PI、HD 分别为幼穗分化期、抽穗期;、分别表示在P<0.05、P<0.01 水平上相关性显著。

图 6光谱反射率与生物学指标的相关系数。LNC、LAI、AGB、GY分别为叶片氮浓度、叶面积指数、地上生物量、籽粒产量。
表2降维后水稻产量相关性状的敏感波段

表3 模型准确率


图7 皮尔逊相关系数法、连续投影算法、竞争性自适应重加权采样法三种降维方法结合机器学习算法,对叶片氮浓度(A–C)、叶面积指数(D–F)、地上生物量(H–J)、籽粒产量(K–M)构建的最优性能模型验证结果LNC、LAI、AGB、GY 分别为叶片氮浓度、叶面积指数、地上生物量、籽粒产量;PCC、SPA、CARS 分别为皮尔逊相关系数法、连续投影算法、竞争性自适应重加权采样法;ANN、SVR、一维 CNN 分别为人工神经网络、支持向量回归、一维卷积神经网络。

图8最优组合模型引入纹理特征后对叶片氮浓度(A)、叶面积指数(B)、地上生物量(C)、籽粒产量(D)的估算结果LNC、LAI、AGB、GY 分别为叶片氮浓度、叶面积指数、地上生物量、籽粒产量;SPA、CARS 分别为连续投影算法、竞争性自适应重加权采样法;ANN 为人工神经网络。
研究结论:在本试验条件下,经连续投影算法(SPA)降维得到的特征波段对叶片氮浓度(LNC)和叶面积指数(LAI)的估算效果最优,而经竞争性自适应重加权采样法(CARS)降维得到的特征波段则对地上生物量(AGB)和籽粒产量(GY)的估算效果更优。采用人工神经网络(ANN)方法构建的 LNC、LAI、AGB、GY 估算模型,其精度和稳定性均优于支持向量回归(SVR)、一维卷积神经网络(1DCNN)和长短期记忆网络(LSTM)模型;其中 SPA-ANN 组合模型为 LNC 和 LAI 的最优估算模型,CARS-ANN 组合模型为 AGB 和 GY 的最优估算模型。在最优组合模型中融入纹理特征后,模型估算精度得到进一步提升,其中基于 LNC 通过 “光谱数据 + 纹理数据 + 降维处理 + 机器学习” 构建的模型,精度提升幅度最为显著。本研究结果为华南籼稻产量相关性状的无损实时预测及表型精准诊断提供了科学依据。
更多推荐

所有评论(0)