Agent Evaluation Search Strategy Scientific Discovery Decision Making
摘要

当前自主研究智能体常依据聚合指标评估科学候选方案,但当有效性存在于细分结构中时,聚合排名可能导致错误决策。本文揭示了一种“反转”现象:全局得分最高的候选者可能破坏关键区域模型,而次优者却能保持结构完整。为此,作者提出一种外部控制循环的搜索纪律协议,在智能体决策后审计候选者的细分行为证据,而非仅依赖单一分数,从而纠正错误的接受或终止决定。

AI 推荐理由

论文提出长程研究智能体的搜索纪律协议,核心在于优化候选评估与决策规划机制。

研究机构
北卡罗来纳州立大学计算机科学系 马里兰大学计算机科学系
论文信息
作者 Adithya Srinivasan, Devesh Paragiri
发布日期 2026-06-09
arXiv ID 2606.11522
相关性评分 8/10 (高度相关)