摘要
传统代理系统在任务分布持续漂移和外部监督稀缺的开放环境中表现不佳。为解决这一问题,本文提出原地自进化范式,将连续任务交互视为经验流,使系统能够在无真实标签的情况下提取短期执行反馈并转化为长期可重用的能力。文中识别工具进化为关键路径,并开发了云界代理系统,通过迭代合成、优化和重用工具应对新挑战。此外,引入并行批量进化策略以提高效率,并通过多个基准测试验证其性能优势。最后,提出一种新的收敛度量指标,用于监控进化过程。
AI 推荐理由
论文提出自进化代理系统,涉及长期能力积累与反馈机制,与Agent Memory相关但非唯一主题。
论文信息