基于融合高光谱与纹理特征的机器学习模型估算水稻产量相关性状

图7皮尔逊相关系数法、连续投影算法、竞争性自适应重加权采样法三种降维方法结合机器学习算法，对叶片氮浓度（A–C）、叶面积指数（D–F）、地上生物量（H–J）、籽粒产量（K–M）构建的最优性能模型验证结果LNC、LAI、AGB、GY 分别为叶片氮浓度、叶面积指数、地上生物量、籽粒产量；图8最优组合模型引入纹理特征后对叶片氮浓度（A）、叶面积指数（B）、地上生物量（C）、籽粒产量（D）的估算结果LNC

YGZXsci8888

364人浏览 · 2026-03-13 15:56:51

YGZXsci8888 · 2026-03-13 15:56:51 发布

Estimating rice yield-related traits using machine learning models integrating hyperspectral

and texture features

研究单位：广东农业科学院水稻研究所；华南农业大学

摘要：

背景：在现代表型组学研究中，无损、高精度且同步快速估算多项性状指标，是实现精准诊断的重要手段。通过“光谱数据+纹理数据+降维处理+机器学习”的技术策略，提升水稻产量相关性状指标（叶片氮浓度LNC、叶面积指数LAI、地上生物量AGB、籽粒产量GY）估算模型的精度，具有重要研究价值。

方法：2022—2023年，同步采集水稻冠层高光谱影像及LNC、LAI、AGB、GY的实测数据；对预处理后的光谱数据分别采用皮尔逊相关系数法、连续投影算法（SPA）、竞争性自适应重加权采样法（CARS）进行降维处理，筛选敏感波长；基于人工神经网络（ANN）、支持向量机回归、一维卷积神经网络、长短期记忆网络构建基础估算模型；提取敏感波长对应的纹理特征，结合“光谱数据+纹理数据+降维处理+机器学习”的方法，构建高精度估算模型。

结果：SPA-ANN组合模型对LNC（决定系数R2=0.82，均方根误差RMSE=3.68 g/kg）和LAI（R2=0.75，RMSE=0.47）的预测效果最优；CARS-ANN组合模型对AGB（R2=0.90，RMSE=79.05 g/m²）和GY（R2=0.63，RMSE=0.59 t/ha）的预测效果最优。添加纹理特征后，模型R2最大提升9.9%，RMSE最大降低27.2%。

结论：本研究优化的技术方法可显著提升水稻产量相关性状估算模型的精度，研究结果为水稻产量相关性状的精准诊断提供了科学依据与技术数据支撑。

数据采集：

本研究采用搭载 X20P 机载高光谱成像仪的中国大疆 M300 RTK 多旋翼无人机，采集水稻冠层高光谱数据。该成像仪的光谱探测范围为 350~1000 nm，光谱分辨率 4 nm，有效波段数 164 个；无人机飞行高度设为 50 m，数据采集时间为北京时间 10:00—14:00，且均在晴天条件下完成。

图1 V1、V2 分别代表水稻品种 “美香占 2 号” 和 “南晶香占”；N0、N1、N2、N3、N4 分别代表施氮量处理，施氮水平依次为 0、60、120、180、240 千克 / 公顷

研究方法：

表1 水稻不同生育期产量相关性状实测值统计

图2 PCC、SPA、CARS 分别为皮尔逊相关系数法、连续投影算法、竞争性自适应重加权采样法；ANN、SVR、一维 CNN、LSTM 分别为人工神经网络、支持向量回归、一维卷积神经网络、长短期记忆网络；PI、HD 分别为幼穗分化期、抽穗期。

图3 美香占 2 号（A、C、E、G）和南晶香占（B、D、F、H）在不同生育期的 SG 平滑冠层光谱反射率。为排除 X20P 传感器光谱两端（900 nm 以上区域尤为明显）的噪声区间，本次展示的光谱范围限定为 400~900 nm，确保用于分析的有效光谱数据呈现清晰。

图4 不同施氮水平对美香占 2 号（A、C、E、G）和南晶香占（B、D、F、H）不同生育期叶片氮浓度、叶面积指数、地上生物量及产量的影响。2022 年早季抽穗期（2022 E HD）、2022 年晚季幼穗分化初期（2022 L PI）、2022 年晚季抽穗期（2022 L HD）、2023 年早季幼穗分化初期（2023 E PI）分别为对应生育期；N0、N1、N2、N3、N4 分别代表施氮量 0、60、120、180、240 千克 / 公顷处理；同一生育期不同施氮水平下的小写字母，表示在p<0.05 水平上存在显著性差异。

图5 水稻不同生育期叶片氮浓度（A）、叶面积指数（B）、地上生物量（C）与产量的相关性，以及叶片氮浓度与叶面积指数（D）、叶片氮浓度与地上生物量（E）、叶面积指数与地上生物量（F）的相关性。PI、HD 分别为幼穗分化期、抽穗期；、分别表示在P<0.05、P<0.01 水平上相关性显著。

图 6光谱反射率与生物学指标的相关系数。LNC、LAI、AGB、GY分别为叶片氮浓度、叶面积指数、地上生物量、籽粒产量。

表2降维后水稻产量相关性状的敏感波段

表3 模型准确率

图7 皮尔逊相关系数法、连续投影算法、竞争性自适应重加权采样法三种降维方法结合机器学习算法，对叶片氮浓度（A–C）、叶面积指数（D–F）、地上生物量（H–J）、籽粒产量（K–M）构建的最优性能模型验证结果LNC、LAI、AGB、GY 分别为叶片氮浓度、叶面积指数、地上生物量、籽粒产量；PCC、SPA、CARS 分别为皮尔逊相关系数法、连续投影算法、竞争性自适应重加权采样法；ANN、SVR、一维 CNN 分别为人工神经网络、支持向量回归、一维卷积神经网络。

图8最优组合模型引入纹理特征后对叶片氮浓度（A）、叶面积指数（B）、地上生物量（C）、籽粒产量（D）的估算结果LNC、LAI、AGB、GY 分别为叶片氮浓度、叶面积指数、地上生物量、籽粒产量；SPA、CARS 分别为连续投影算法、竞争性自适应重加权采样法；ANN 为人工神经网络。

研究结论：在本试验条件下，经连续投影算法（SPA）降维得到的特征波段对叶片氮浓度（LNC）和叶面积指数（LAI）的估算效果最优，而经竞争性自适应重加权采样法（CARS）降维得到的特征波段则对地上生物量（AGB）和籽粒产量（GY）的估算效果更优。采用人工神经网络（ANN）方法构建的 LNC、LAI、AGB、GY 估算模型，其精度和稳定性均优于支持向量回归（SVR）、一维卷积神经网络（1DCNN）和长短期记忆网络（LSTM）模型；其中 SPA-ANN 组合模型为 LNC 和 LAI 的最优估算模型，CARS-ANN 组合模型为 AGB 和 GY 的最优估算模型。在最优组合模型中融入纹理特征后，模型估算精度得到进一步提升，其中基于 LNC 通过 “光谱数据 + 纹理数据 + 降维处理 + 机器学习” 构建的模型，精度提升幅度最为显著。本研究结果为华南籼稻产量相关性状的无损实时预测及表型精准诊断提供了科学依据。

原文链接：https://doi.org/10.3389/fpls.2025.1713014

2048 AI社区

有“AI”的1024 = 2048，欢迎大家加入2048 AI社区

更多推荐

2026 年最值得关注的两个开源项目：从金融终端到 AI Agent 框架的架构启示

2048 AI社区

如何设计一个真正能解决问题的 AI Agent Harness Engineering 任务分解系统

想象一下，你是一家创新科技公司的首席技术官。你的团队刚刚开发出一款功能强大的 AI 助手，你满怀信心地向 CEO 演示：“只要给它一个任务，它就能自动完成！CEO 眼睛一亮，说：“太好了！那让它帮我们解决一个问题——设计并开发一款能颠覆市场的新一代产品，从概念到上市的全流程。你兴奋地把这个任务交给了 AI 助手。然而，几小时后，你收到的回复却是：“任务过于复杂，无法处理。这时你才意识到，虽然我们的

2048 AI社区

Legacy模式下VRTX磁盘更新步骤与常见问题处理

摘要：本文针对戴尔PowerEdge VRTX服务器在Legacy BIOS模式下更新磁盘的常见问题进行分析。主要问题包括：1)新磁盘未被RAID控制器识别，需通过Ctrl+R进入配置界面初始化；2)Legacy模式与UEFI磁盘格式(MBR与GPT)不兼容导致引导失败；3)磁盘启动顺序混乱。解决方案包括：检查RAID控制器状态，确保选择Legacy/MBR选项创建虚拟磁盘，并在BIOS中手动调整