摘要
检索增强生成(RAG)已成为知识密集型LLM任务的标准方法,但现有系统通常将每个查询视为独立处理,导致重复检索和推理,增加计算成本。本文提出AutoPrunedRetriever,一种基于图结构的RAG系统,通过持久化早期问题构建的最小推理子图,并逐步扩展以处理后续问题。该系统使用紧凑的ID索引代码本存储实体和关系,将问题、事实和答案表示为边序列,从而在符号结构上进行检索和提示。为了保持图的紧凑性,采用两层整合策略(快速ANN/KNN别名检测和达到内存阈值后的选择性k-means),并修剪低价值结构,同时保留重叠代表和真正的新证据。实验表明,在GraphRAG-Benchmark(医学和新领域)上,两种变体均达到最先进的复杂推理准确率,优于HippoRAG2约9-11分,并在上下文摘要和生成任务中保持竞争力。在更难的STEM和TV基准测试中,AutoPrunedRetriever再次排名第一,且使用的token数量比基于图的基线少两个数量级,使其成为长期会话、动态语料库和多代理流水线的实用基础。
AI 推荐理由
论文提出了一种基于图结构的RAG系统,核心是通过持久化和扩展最小推理子图实现高效记忆管理。
论文信息