Agent Experience Learning Computer Use Agent Synthetic Data Generation
摘要

本研究提出了一种名为EvoCUA的原生计算机使用代理模型,旨在突破静态数据扩展对多模态AI发展的限制。现有方法依赖于对静态数据集的被动模仿,难以捕捉长期计算机任务中的复杂因果动态。为解决这一问题,EvoCUA将数据生成与策略优化整合到一个自维持的演化循环中,并开发了一个可验证的合成引擎以自主生成多样化任务及执行验证器。此外,设计了可扩展的基础设施,协调数万个异步沙箱运行,以实现大规模经验获取。基于这些轨迹,提出了一种迭代演化学习策略,通过识别能力边界动态调节策略更新,从而强化成功操作并利用错误分析和自我修正将失败轨迹转化为丰富的监督信号。实验表明,EvoCUA在OSWorld基准测试中取得了56.7%的成功率,显著优于其他开源和闭源模型。

AI 推荐理由

论文涉及通过经验学习和演化机制提升Agent能力,与Memory相关但非核心。

论文信息
作者 Taofeng Xue, Chong Peng, Mianqiu Huang, Linsen Guo, Tiancheng Han et al.
发布日期 2026-01-22
arXiv ID 2601.15876
相关性评分 6/10 (相关)