Document Understanding Agentic Search Structure-Aware Reasoning RAG
摘要

随着大模型工具使用能力的提升,检索增强生成正转向自主多轮证据获取。然而,现有代理搜索框架常将长文档视为无序片段集合,忽视了其固有的层级结构与顺序逻辑。为此,本文提出 DeepRead,一种具备文档结构感知能力的推理代理。该系统利用现代 OCR 的结构保真度,构建段落级坐标导航系统,并配备“定位”与“按序阅读”两种协同工具,激发类人的“先定位后阅读”推理范式,有效缓解传统检索中的上下文碎片化问题。实验表明,DeepRead 在多个基准测试中显著优于现有基线。

AI 推荐理由

论文核心提出结构感知推理范式,利用文档层级逻辑增强 Agent 的精准推理能力。

研究机构
中国科学院自动化研究所人工智能实验室 中国科学院大学
论文信息
作者 Zhanli Li, Huiwen Tian, Lvzhou Luo, Yixuan Cao, Ping Luo
发布日期 2026-02-04
arXiv ID 2602.05014
相关性评分 9/10 (高度相关)