摘要
当前的信息检索(InfoSeeking)智能体在长时程探索过程中难以保持焦点和连贯性,因为在一个纯文本上下文中跟踪搜索状态(包括规划过程和大量搜索结果)本质上是脆弱的。为了解决这一问题,我们引入了Table-as-Search(TaS),一种结构化的规划框架,将信息检索任务重新表述为表格补全任务。TaS将每个查询映射到外部数据库中维护的结构化表格模式中,其中行表示搜索候选,列表示约束或所需信息。该表格精确地管理搜索状态:已填充的单元格严格记录历史和搜索结果,而空单元格则作为显式的搜索计划。关键的是,TaS统一了三种不同的信息检索任务:深度搜索、广度搜索以及具有挑战性的深度广度搜索。广泛的实验表明,TaS在三个类型的基准测试中显著优于众多最先进的基线方法,包括多智能体框架和商业系统。此外,我们的分析验证了TaS在长时程信息检索中的优越鲁棒性,同时具备高效性、可扩展性和灵活性。代码和数据集已在https://github.com/AIDC-AI/Marco-Search-Agent上公开发布。
AI 推荐理由
论文提出Table-as-Search框架,通过结构化表格管理搜索状态,涉及记忆机制的实现与优化。
论文信息