摘要
基于大语言模型(LLM)的代理广泛应用于面向用户的场景,但在新任务中仍容易出错,倾向于重复相同的失败模式,并表现出显著的运行间差异性。通过环境特定训练或手动修补来修复故障成本高昂且难以扩展。为实现用户面向服务环境中的自我演进代理,本文提出WISE-Flow,一种以工作流为中心的框架,通过引入带有先决条件增强的动作块,将历史服务交互转化为可重用的过程性经验。在部署时,WISE-Flow将代理的执行轨迹对齐到检索到的工作流,并进行先决条件感知的可行性推理,以实现状态驱动的下一步动作。在ToolSandbox和$τ^2$-bench上的实验表明,该方法在基础模型上均表现出一致的改进。
AI 推荐理由
论文提出基于工作流的结构化经验机制,与Agent Memory相关,但非唯一主题。
论文信息