多智能体系统 科学数据分析 强化学习 监督微调
摘要

在科学研究中,分析需要准确解读复杂的多模态知识,整合不同来源的证据,并基于领域特定知识进行推理。然而,当前的人工智能系统难以持续展示此类能力。科学表格和图表的复杂性与变异性,结合异构结构和长上下文需求,构成了科学表格与图表分析的根本障碍。为量化这些挑战,我们引入了AnaBench,一个包含63,178个实例的大规模基准测试集,涵盖九个科学领域,并沿七个复杂性维度进行系统分类。为应对这些挑战,我们提出Anagent,一种通过四个专门智能体增强科学表格与图表分析的多智能体框架:Planner将任务分解为可操作的子任务,Expert通过针对性工具执行检索任务特定信息,Solver综合信息生成连贯分析,Critic通过五维质量评估进行迭代优化。我们进一步开发了模块化训练策略,利用监督微调和专用强化学习来优化个体能力并保持有效协作。在170个子领域的全面评估表明,Anagent在无训练设置下实现了高达13.43%的提升,在微调设置下实现了42.12%的提升,同时揭示了面向任务的推理和上下文感知的问题解决对于高质量科学表格与图表分析至关重要。

AI 推荐理由

论文涉及多智能体框架,但未明确讨论Agent Memory机制或系统。

论文信息
作者 Xuehang Guo, Zhiyong Lu, Tom Hope, Qingyun Wang
发布日期 2026-02-10
arXiv ID 2602.10081
相关性评分 5/10 (一般相关)