多代理系统 动态通信 策略梯度 任务导向
摘要

基于LLM的多轮多代理系统依赖于有效的通信结构以支持跨轮次协作。然而,现有方法大多在推理过程中采用固定的通信拓扑,难以应对现实中因动态对抗、任务进展或通信带宽等时变约束导致的代理角色变化。本文提出TodyComm,一种面向任务的动态通信算法,通过行为驱动的协作拓扑适应每一轮的动态变化,并利用策略梯度优化任务效用。实验结果表明,在动态对抗和通信预算限制下,TodyComm在保持标记效率和可扩展性的同时,实现了更优的任务效果。

AI 推荐理由

论文涉及多轮代理系统中的动态通信机制,与Agent Memory相关但非核心主题。

论文信息
作者 Wenzhe Fan, Tommaso Tognoli, Henry Peng Zou, Chunyu Miao, Yibo Wang et al.
发布日期 2026-02-03
arXiv ID 2602.03688
相关性评分 6/10 (相关)