摘要
多智能体系统通过轮流交互解决问题,广泛应用于医疗、法律等高风险领域。然而,当单个智能体基于错误上下文(如工具调用)进行推理时,错误可能在交互中传播。本文通过在推理、知识和对齐任务中注入意图性错误信息,研究了该风险。研究发现,错误信息会降低单智能体性能并在多智能体辩论中持续存在,但多智能体辩论相比单智能体提示能减轻性能下降。系统的鲁棒性取决于群体组成和决策协议,共识机制比投票更稳定,多数派往往能引导受误导智能体回归正确答案。
AI 推荐理由
研究多智能体在错误信息下的推理鲁棒性,推理是核心评估对象。
研究机构
University of Göttingen, Germany
LKA NRW, Germany
论文信息