摘要
随着大模型工具使用能力的提升,检索增强生成正转向自主多轮证据获取。然而,现有代理搜索框架常将长文档视为无序片段集合,忽视了其固有的层级结构与顺序逻辑。为此,本文提出 DeepRead,一种具备文档结构感知能力的推理代理。该系统利用现代 OCR 的结构保真度,构建段落级坐标导航系统,并配备“定位”与“按序阅读”两种协同工具,激发类人的“先定位后阅读”推理范式,有效缓解传统检索中的上下文碎片化问题。实验表明,DeepRead 在多个基准测试中显著优于现有基线。
AI 推荐理由
论文核心提出结构感知推理范式,利用文档层级逻辑增强 Agent 的精准推理能力。
研究机构
中国科学院自动化研究所人工智能实验室
中国科学院大学
论文信息