长程研究智能体的搜索纪律

Agent Evaluation Search Strategy Scientific Discovery Decision Making

摘要

当前自主研究智能体常依据聚合指标评估科学候选方案，但当有效性存在于细分结构中时，聚合排名可能导致错误决策。本文揭示了一种“反转”现象：全局得分最高的候选者可能破坏关键区域模型，而次优者却能保持结构完整。为此，作者提出一种外部控制循环的搜索纪律协议，在智能体决策后审计候选者的细分行为证据，而非仅依赖单一分数，从而纠正错误的接受或终止决定。

AI 推荐理由

论文提出长程研究智能体的搜索纪律协议，核心在于优化候选评估与决策规划机制。

研究机构

北卡罗来纳州立大学计算机科学系马里兰大学计算机科学系

论文信息

作者 Adithya Srinivasan, Devesh Paragiri

发布日期 2026-06-09

arXiv ID 2606.11522