多智能体协作 技能库 共进化 在线优化 LLM Agent
摘要

大型语言模型正在使交互环境中的语言条件代理成为可能,但高度协作的任务通常同时带来两个约束:亚秒级实时协调和在严格的在线token预算下持续的多回合适应。现有方法要么依赖频繁的回合内推理导致延迟和时间抖动,要么通过非结构化文本实现回合后改进,难以编译为可靠且低成本的执行方案。本文提出CoWork-X,一种主动共进化框架,将同伴协作视为跨回合的闭环优化问题,受快慢记忆分离启发。CoWork-X实例化了一个Skill-Agent,通过从结构化、可解释且组合化的技能库中进行HTN(分层任务网络)基础的技能检索来执行,并引入一个回合后Co-Optimizer,通过显式预算约束和漂移正则化进行补丁式技能整合。在具有挑战性的类似Overcooked-AI的实时协作基准测试中,实验表明CoWork-X实现了稳定的累积性能提升,同时逐步降低在线延迟和token使用量。

AI 推荐理由

论文提出基于快慢记忆分离的框架,涉及技能库和在线优化,与Agent Memory相关。

论文信息
作者 Zexin Lin, Jiachen Yu, Haoyang Zhang, Yuzhao Li, Zhonghang Li et al.
发布日期 2026-02-04
arXiv ID 2602.05004
相关性评分 7/10 (相关)