摘要
大型语言模型代理常难以从经验中积累知识,视每项任务为独立挑战。现有方法将经验提取为扁平文本,无法捕捉复杂子任务的程序逻辑,且缺乏维护机制导致知识库退化。本文提出 AutoRefine 框架,从执行历史中提取并维护双重形式的经验模式:针对程序性子任务提取具备独立推理与记忆的专业子代理,针对静态知识提取技能模式作为指南或代码片段。该框架包含连续维护机制,通过评分、剪枝和合并模式防止库退化。实验表明,AutoRefine 在多个基准测试中显著优于现有方法,证明了其捕捉程序协调性的能力。
AI 推荐理由
论文核心在于通过提取经验模式和维护机制实现 Agent 的持续自我改进与进化。
研究机构
阿里巴巴集团
论文信息