摘要
农业领域的基础模型越来越多地基于大规模时空数据(如多光谱遥感、土壤网格和田间管理日志)进行训练,并在预测和监测方面表现出色。然而,这些模型缺乏基于语言的推理和交互能力,限制了其在实际农业工作流程中的应用。同时,大型语言模型(LLMs)擅长解释和生成文本,但无法直接对高维、异构的农业数据集进行推理。为此,本文提出了一种用于农业科学的智能体框架,提供了一个Python执行环境AgriWorld,统一暴露了针对田块的地理空间查询、遥感时间序列分析、作物生长模拟以及任务特定预测器(如产量、压力和病害风险)等工具。在此基础上,设计了一个多轮LLM代理Agro-Reflective,通过执行-观察-反思循环迭代编写代码、观察执行结果并优化分析。此外,引入了AgroBench基准测试平台,支持多样化的农业问答任务,包括查找、预测、异常检测和反事实“假设”分析。实验表明,该方法优于仅基于文本和直接工具使用的基线方法,验证了以执行驱动的反思机制在可靠农业推理中的有效性。
AI 推荐理由
论文涉及LLM Agent通过执行-观察-反思循环进行农业推理,与记忆机制相关但非核心主题。
论文信息