摘要
大型语言模型(LLMs)在知识密集型任务中常因幻觉和过时参数知识而表现不佳。尽管检索增强生成(RAG)通过整合外部语料库来解决这一问题,但其效果受到非结构化领域文档中碎片化信息的限制。图增强RAG(GraphRAG)通过结构化知识图谱增强了上下文推理能力,但在实际场景中却表现出显著的准确性下降和不可接受的延迟,尽管在复杂查询上有所提升。我们发现,GraphRAG对所有查询(无论复杂度如何)的刚性应用是根本原因。为了解决这一问题,我们提出了一种高效且自适应的GraphRAG框架EA-GraphRAG,通过语法感知的复杂度分析动态集成RAG和GraphRAG范式。我们的方法包括:(i) 一个句法特征构造器,解析每个查询并提取一组结构特征;(ii) 一个轻量级复杂度评分器,将这些特征映射到连续的复杂度评分;以及(iii) 一种基于评分的路由策略,对低评分查询选择密集型RAG,对高评分查询调用基于图的检索,并对边界情况应用复杂度感知的倒数排名融合。在包含两个单跳和两个多跳问答基准的全面基准测试中,我们的EA-GraphRAG显著提高了准确性,减少了延迟,并在处理混合场景(包含简单和复杂查询)方面达到了最先进的性能。
AI 推荐理由
论文涉及GraphRAG与RAG的结合,用于增强记忆检索和推理,属于Agent Memory相关研究。
论文信息