Deep Search Trajectory Compression Global Planning ReAct Improvement
摘要

基于大语言模型的深度研究智能体多采用 ReAct 框架,其线性设计难以回溯状态或维持长上下文下的全局意识,易导致局部最优。本文提出 Re-TRAC 框架,通过在每次轨迹后生成结构化状态表示(总结证据、不确定性及未来计划),并以此条件化后续轨迹,实现跨轨迹探索。该方法将研究重构为渐进过程,支持迭代反思与全局规划。实验表明,Re-TRAC 在 BrowseComp 基准上优于 ReAct 15-20%,且显著减少工具调用与令牌消耗,实现了更精准的定向探索。

AI 推荐理由

提出递归轨迹压缩框架,实现全局感知规划与迭代反思,核心解决多步搜索中的规划效率问题。

研究机构
微软亚洲研究院
论文信息
作者 Jialiang Zhu, Gongrui Zhang, Xiaolong Ma, Lin Xu, Miaosen Zhang et al.
发布日期 2026-02-02
arXiv ID 2602.02486
相关性评分 9/10 (高度相关)