Agentic Search Query Diversity Test-time Scaling
摘要

智能体搜索的测试时扩展通常增加深度或广度。本文聚焦广度扩展,指出标准并行采样因首轮查询冗余导致收益递减。为此,作者提出 DivInit,一种无需训练的首轮干预方法:从单次调用中抽取多个候选查询,筛选出多样化的种子作为并行轨迹起点。在五个开源模型和八个基准测试中,DivInit 在同等算力下显著优于标准并行采样,多跳问答任务平均提升 5 至 7 分。

AI 推荐理由

论文聚焦智能体搜索的广度扩展与初始查询规划,提出多样化初始化策略以优化多步轨迹。

研究机构
Carnegie Mellon University, United States Instituto Superior Técnico and INESC-ID, University of Lisbon, Portugal NOVA LINCS, NOVA School of Science and Technology, Portugal
论文信息
作者 Sidhaarth Murali, João Coelho, Jingjie Ning, João Magalhães, Bruno Martins et al.
发布日期 2026-06-15
arXiv ID 2606.17209
相关性评分 8/10 (高度相关)