摘要
基于大语言模型的多智能体系统,尤其是集中式架构,在复杂和知识密集型任务中展现出强大潜力。然而,中央智能体常因缺乏记忆管理而面临长期协作不稳定的问题,导致上下文膨胀、错误累积和跨任务泛化能力差。为了解决任务级记忆效率低下及无法复用协调经验的问题,本文提出StackPlanner,一种具有显式记忆控制的分层多智能体框架。该框架通过将高层协调与子任务执行解耦,并结合主动任务级记忆控制,以及结构化经验记忆与强化学习来检索和利用可复用的协调经验,从而有效应对上述挑战。在多个深度搜索和多智能体系统基准测试中的实验表明,该方法能够实现可靠长期的多智能体协作。
AI 推荐理由
论文明确提出任务经验记忆管理,核心解决记忆控制与复用问题,属于Agent Memory机制研究。
论文信息