Continual Learning Experience Replay Agent Refinement Knowledge Maintenance
摘要

大型语言模型代理常难以从经验中积累知识,视每项任务为独立挑战。现有方法将经验提取为扁平文本,无法捕捉复杂子任务的程序逻辑,且缺乏维护机制导致知识库退化。本文提出 AutoRefine 框架,从执行历史中提取并维护双重形式的经验模式:针对程序性子任务提取具备独立推理与记忆的专业子代理,针对静态知识提取技能模式作为指南或代码片段。该框架包含连续维护机制,通过评分、剪枝和合并模式防止库退化。实验表明,AutoRefine 在多个基准测试中显著优于现有方法,证明了其捕捉程序协调性的能力。

AI 推荐理由

论文核心在于通过提取经验模式和维护机制实现 Agent 的持续自我改进与进化。

研究机构
阿里巴巴集团
论文信息
作者 Libin Qiu, Zhirong Gao, Junfu Chen, Yuhang Ye, Weizhi Huang et al.
发布日期 2026-01-30
arXiv ID 2601.22758
相关性评分 9/10 (高度相关)