摘要
基于大语言模型的智能体在自动化科学发现中潜力巨大。本文认为,当前瓶颈已从设计工作流转向设计代理环境。作者提出“环境工程”范式,通过构建能放大有益行为(如开放式探索)并抑制有害行为的环境来优化代理表现。EurekAgent 系统在权限、工件、预算及人机协作四个维度进行工程设计,在数学、内核工程及机器学习任务中创下新纪录,证明了环境工程对开发可靠自主研究代理的关键作用。
AI 推荐理由
论文核心为环境工程,但旨在优化 Agent 的自主探索与任务执行流程,紧密关联规划能力。
研究机构
清华大学
智谱AI
论文信息