MARS：用于自动化 AI 研究的具有反思搜索能力的模块化智能体

AI Research Automation Monte Carlo Tree Search Reflective Memory Modular Agent

摘要

自动化 AI 研究因评估成本高且归因不透明而极具挑战，现有 LLM 智能体常生成忽视成本的单体脚本。本文提出 MARS 框架，其三大支柱包括：(1) 基于成本约束蒙特卡洛树搜索的预算感知规划，显式平衡性能与开销；(2) 采用“设计 - 分解 - 实现”流程的模块化构建，管理复杂研究仓库；(3) 比较反思记忆，通过分析方案差异解决归因问题并提炼高价值洞察。MARS 在 MLE-Bench 上达到开源框架最先进水平，并展现出跨分支迁移洞察的泛化能力。

AI 推荐理由

论文核心提出基于 MCTS 的预算感知规划机制，显式平衡性能与执行成本，是系统关键支柱。

研究机构

Google Cloud AI Research

论文信息

作者 Jiefeng Chen, Bhavana Dalvi Mishra, Jaehyun Nam, Rui Meng, Tomas Pfister et al.

发布日期 2026-02-02

arXiv ID 2602.02660