Long-Horizon Planning Data Synthesis Agent Training Software Evolution
摘要

大型语言模型在短程任务表现优异,但扩展至长程智能体工作流仍具挑战,核心瓶颈在于缺乏捕捉长依赖结构与跨阶段演化动态的训练数据。本文提出 daVinci-Agency,通过重构真实软件演化过程中的拉取请求(PR)序列来合成数据。该方法利用连续提交进行渐进式任务分解,通过统一功能目标确保长期一致性,并从真实的缺陷修复轨迹中获取可验证的优化信号。实验表明,仅需少量样本微调即可显著提升模型在长程基准测试中的表现。

AI 推荐理由

论文核心解决长程任务规划瓶颈,通过 PR 序列实现任务分解与目标一致性。

研究机构
SJTU GAI R
论文信息
作者 Mohan Jiang, Dayuan Fu, Junhao Shi, Ji Zeng, Weiye Si et al.
发布日期 2026-02-02
arXiv ID 2602.02619
相关性评分 9/10 (高度相关)