AutoRefine：从轨迹到可复用专业知识以实现持续的 LLM Agent 优化

Continual Learning Experience Replay Agent Refinement Knowledge Maintenance

摘要

大型语言模型代理常难以从经验中积累知识，视每项任务为独立挑战。现有方法将经验提取为扁平文本，无法捕捉复杂子任务的程序逻辑，且缺乏维护机制导致知识库退化。本文提出 AutoRefine 框架，从执行历史中提取并维护双重形式的经验模式：针对程序性子任务提取具备独立推理与记忆的专业子代理，针对静态知识提取技能模式作为指南或代码片段。该框架包含连续维护机制，通过评分、剪枝和合并模式防止库退化。实验表明，AutoRefine 在多个基准测试中显著优于现有方法，证明了其捕捉程序协调性的能力。

AI 推荐理由

论文核心在于通过提取经验模式和维护机制实现 Agent 的持续自我改进与进化。

研究机构

阿里巴巴集团

论文信息

作者 Libin Qiu, Zhirong Gao, Junfu Chen, Yuhang Ye, Weizhi Huang et al.

发布日期 2026-01-30

arXiv ID 2601.22758