multi-agent communication MARL emergent language LLMs agent collaboration
摘要

多智能体序列决策在许多现实系统中发挥着重要作用,例如自动驾驶车辆、机器人和协作AI助手。在动态且部分可观测的环境中,通信通常是减少不确定性并实现协作的关键。本综述通过五个W(Who, What, When, Where, Why)框架回顾了多智能体通信(MA-Comm)。该框架提供了一种清晰的方式,将不同研究方向的思想联系起来。我们追踪了通信方法在三个主要范式中的演变过程:在多智能体强化学习(MARL)中,早期方法使用手工设计或隐式协议,随后发展为端到端学习的通信方法以优化奖励和控制。尽管这些方法取得了成功,但它们通常任务特定且难以解释,这促使了对涌现语言(EL)的研究,其中智能体可以通过交互发展出更结构化或符号化的通信方式。然而,EL方法仍面临语义锚定、泛化和可扩展性方面的挑战,这推动了近期对大型语言模型(LLMs)的兴趣,因为LLMs能够带来自然语言先验知识,用于更开放场景下的推理、规划和协作。我们强调了在MARL、EL和基于LLM的系统中,不同选择如何塑造通信设计,主要权衡点以及尚未解决的问题,并提炼出实用的设计模式和开放挑战,以支持未来结合学习、语言和控制的混合系统,实现可扩展且可解释的多智能体协作。

AI 推荐理由

论文涉及多智能体通信机制,与Agent Memory相关,但非核心主题。

论文信息
作者 Jingdi Chen, Hanqing Yang, Zongjun Liu, Carlee Joe-Wong
发布日期 2026-02-12
arXiv ID 2602.11583
相关性评分 7/10 (相关)