摘要
自动化 AI 研究因评估成本高且归因不透明而极具挑战,现有 LLM 智能体常生成忽视成本的单体脚本。本文提出 MARS 框架,其三大支柱包括:(1) 基于成本约束蒙特卡洛树搜索的预算感知规划,显式平衡性能与开销;(2) 采用“设计 - 分解 - 实现”流程的模块化构建,管理复杂研究仓库;(3) 比较反思记忆,通过分析方案差异解决归因问题并提炼高价值洞察。MARS 在 MLE-Bench 上达到开源框架最先进水平,并展现出跨分支迁移洞察的泛化能力。
AI 推荐理由
论文核心提出基于 MCTS 的预算感知规划机制,显式平衡性能与执行成本,是系统关键支柱。
研究机构
Google Cloud AI Research
论文信息