摘要
近年来,大语言模型(LLMs)的进步使得代理能够将动作表示为可执行代码,相较于传统的工具调用方式具有更高的表达能力。然而,现实任务通常需要战略规划和详细实现。使用单一代理完成这两项任务会导致调试痕迹和中间失败的上下文污染,从而影响长期性能。我们提出了CodeDelegator,一种通过角色专业化分离规划与实现的多代理框架。一个持久的Delegator通过分解任务、编写规范和监控进度来保持战略监督,而不执行代码。对于每个子任务,会实例化一个新的Coder代理,其上下文中仅包含其规范,从而避免受到先前失败的影响。为了协调代理之间的工作,我们引入了短暂-持久状态分离(EPSS),隔离每个Coder的执行状态,同时保持全局一致性,防止调试痕迹污染Delegator的上下文。在多个基准测试上的实验表明,CodeDelegator在各种场景中均表现出有效性。
AI 推荐理由
论文提出通过角色分离解决上下文污染问题,涉及Agent Memory的核心机制。
论文信息