摘要
检索增强生成(RAG)通过外部证据支撑大语言模型输出,但在需要长推理的多跳问答任务中仍面临挑战。近期研究从两个互补维度扩展RAG:顺序深度用于迭代优化和并行宽度用于覆盖扩展。然而,简单扩展导致上下文污染和效率低下,计算增加但效果不升反降。为解决这些问题,本文提出SPARC-RAG,一种多智能体框架,在统一的上下文管理机制下协调顺序与并行推理扩展。SPARC-RAG采用专门智能体维护共享全局上下文,并对扩展过程进行显式控制。它为每个分支生成针对性、互补性子问题以实现多样化的并行探索,并根据答案正确性和证据支撑情况显式调节退出决策。为进一步优化扩展行为,本文引入一种轻量级微调方法,结合可验证的过程级偏好,提升了顺序扩展的效率和并行扩展的效果。在单跳和多跳问答基准测试中,SPARC-RAG始终优于之前的RAG基线模型,在更低的推理成本下平均F1值提升6.2。
AI 推荐理由
论文提出SPARC-RAG框架,涉及上下文管理与多智能体协作,与Agent Memory密切相关。
论文信息