Autonomous Coding Agents Optimization Modeling Code Execution Agent Collaboration
摘要

本文提出 NEMO 系统,能将自然语言描述的决策问题转化为可执行的数学优化代码。该系统以自主编码代理(ACA)为核心抽象,通过在沙箱环境中执行代码确保语法正确性与可执行性,并支持自动验证与修复。文章引入了多种新颖的代理协作模式,包括优化器与模拟器间的非对称验证循环、用于经验复用的外部记忆机制,以及基于最小贝叶斯风险解码的鲁棒性增强策略。在九个基准测试中,NEMO 展现了最先进的性能,证明了执行感知代理架构在自动化优化建模中的强大能力。

AI 推荐理由

论文核心研究自主编码代理(ACA)的代码生成、执行验证及工具协作技能,属于高阶技能学习。

研究机构
C3 AI, 1400 Seaport Blvd, Redwood City, CA 94063 Language Technologies Institute, Carnegie Mellon University
论文信息
作者 Yang Song, Anoushka Vyas, Zirui Wei, Sina Khoshfetrat Pakazad, Henrik Ohlsson et al.
发布日期 2026-01-29
arXiv ID 2601.21372
相关性评分 9/10 (高度相关)