daVinci-Agency：数据高效地解锁长程智能体能力

Long-Horizon Planning Data Synthesis Agent Training Software Evolution

摘要

大型语言模型在短程任务表现优异，但扩展至长程智能体工作流仍具挑战，核心瓶颈在于缺乏捕捉长依赖结构与跨阶段演化动态的训练数据。本文提出 daVinci-Agency，通过重构真实软件演化过程中的拉取请求（PR）序列来合成数据。该方法利用连续提交进行渐进式任务分解，通过统一功能目标确保长期一致性，并从真实的缺陷修复轨迹中获取可验证的优化信号。实验表明，仅需少量样本微调即可显著提升模型在长程基准测试中的表现。

AI 推荐理由

论文核心解决长程任务规划瓶颈，通过 PR 序列实现任务分解与目标一致性。

研究机构

SJTU GAI R

论文信息

作者 Mohan Jiang, Dayuan Fu, Junhao Shi, Ji Zeng, Weiye Si et al.

发布日期 2026-02-02

arXiv ID 2602.02619