面向多智能体讨论的上下文学习

Multi-Agent Discussion Context Learning Consensus Reasoning LLM Collaboration

摘要

多智能体讨论（MAD）近期备受关注，但在结构化协作中常因个体上下文错位导致讨论不一致及无法达成连贯解。本文提出多大模型上下文学习方法（M2CL），为每个智能体训练上下文生成器，通过自动信息组织与细化动态生成每轮讨论指令。该方法利用自适应机制控制上下文一致性与输出差异，避免过早收敛于噪声并逐步达成正确共识。在学术推理、具身任务及移动控制等挑战性问题上的评估显示，M2CL 性能显著超越现有方法 20%-50%，且具备优异的迁移性与计算效率。

AI 推荐理由

论文核心解决多智能体讨论中的推理不一致问题，通过上下文学习提升共识推理能力。

研究机构

清华大学计算机科学与技术系西北大学计算机学院之江实验室

论文信息

作者 Xingyuan Hua, Sheng Yue, Xinyi Li, Yizhe Zhao, Jinrui Zhang et al.

发布日期 2026-02-02

arXiv ID 2602.02350