摘要
本文提出 NEMO 系统,能将自然语言描述的决策问题转化为可执行的数学优化代码。该系统以自主编码代理(ACA)为核心抽象,通过在沙箱环境中执行代码确保语法正确性与可执行性,并支持自动验证与修复。文章引入了多种新颖的代理协作模式,包括优化器与模拟器间的非对称验证循环、用于经验复用的外部记忆机制,以及基于最小贝叶斯风险解码的鲁棒性增强策略。在九个基准测试中,NEMO 展现了最先进的性能,证明了执行感知代理架构在自动化优化建模中的强大能力。
AI 推荐理由
论文核心研究自主编码代理(ACA)的代码生成、执行验证及工具协作技能,属于高阶技能学习。
研究机构
C3 AI, 1400 Seaport Blvd, Redwood City, CA 94063
Language Technologies Institute, Carnegie Mellon University
论文信息