摘要
大型语言模型在短程任务表现优异,但扩展至长程智能体工作流仍具挑战,核心瓶颈在于缺乏捕捉长依赖结构与跨阶段演化动态的训练数据。本文提出 daVinci-Agency,通过重构真实软件演化过程中的拉取请求(PR)序列来合成数据。该方法利用连续提交进行渐进式任务分解,通过统一功能目标确保长期一致性,并从真实的缺陷修复轨迹中获取可验证的优化信号。实验表明,仅需少量样本微调即可显著提升模型在长程基准测试中的表现。
AI 推荐理由
论文核心解决长程任务规划瓶颈,通过 PR 序列实现任务分解与目标一致性。
研究机构
SJTU
GAI R
论文信息