RAG LLM Agent 信息检索 生成模型
摘要

检索增强生成(RAG)系统通常由生成器和检索组件组成,从知识库中提取文本上下文以回答用户查询。然而,这种基本实现存在诸多限制,包括检索结果噪声大或次优、对超出范围的查询使用不当、查询与文档匹配较弱以及生成器的变异性或成本问题。这些缺陷促使了“增强型”RAG的发展,其中引入了专门模块以解决工作流程中的特定弱点。最近,大型语言模型(LLMs)日益增强的自我反思能力催生了一种新的范式,即“智能体型”RAG。在此方法中,LLM负责协调整个过程,决定执行哪些操作、何时执行以及是否迭代,从而减少对固定手动设计模块的依赖。尽管这两种范式的应用迅速增长,但在何种条件下哪种方法更优仍不清楚。本文通过多个场景和维度进行了广泛的实证评估,结果为两种范式之间的权衡提供了实用见解,并为现实应用中选择最有效的RAG设计提供了指导,兼顾成本与性能。

AI 推荐理由

论文探讨了RAG系统改进方法,涉及记忆检索与生成的协同机制,但未聚焦于Agent Memory本身。

论文信息
作者 Pietro Ferrazzi, Milica Cvjeticanin, Alessio Piraccini, Davide Giannuzzi
发布日期 2026-01-12
arXiv ID 2601.07711
相关性评分 6/10 (相关)