Multi-Hop QA RAG Optimization Cost Efficiency
摘要

检索增强生成(RAG)已成为知识密集型问答的关键范式。然而,现有系统因在每一步交替进行检索与推理,导致 LLM 重复调用、令牌消耗高且实体对齐不稳定。本文提出 CompactRAG 框架,将离线语料重构与在线推理解耦。离线阶段构建原子 QA 知识库;在线阶段通过密集检索和答案提取解决问题,无论推理步数多少,LLM 仅被调用两次。实验表明,该方法在保持竞争力的同时大幅降低了成本。

AI 推荐理由

论文核心解决多跳问答中的推理效率问题,通过解耦检索与推理显著优化推理过程。

研究机构
State Key Laboratory for Novel Software Technology, Nanjing University 苏州大学,中国 Erik Jonsson School of Engineering and Computer Science, University of Texas at Dallas 德克萨斯大学达拉斯分校,美国 Isoftstone Information Technology (Group) Co.,Ltd. 北京,中国 College of Electronic and Information Engineering, Tongji University 上海,中国 School of Electronic Information, Central South University 长沙,中国 南京,中国
论文信息
作者 Hao Yang, Zhiyu Yang, Xupeng Zhang, Wei Wei, Yunjie Zhang et al.
发布日期 2026-02-05
arXiv ID 2602.05728
相关性评分 9/10 (高度相关)