Multi-Agent System Software Engineering Autonomous Agents Team Collaboration
摘要

大型语言模型在个体软件工程任务中表现优异,但现有自治系统多将问题解决视为单体或流水线过程。本文提出 Agyn,一个完全自动化的多智能体系统,显式地将软件工程建模为组织过程,复现工程团队结构。该系统基于开源平台配置,分配协调、研究、实现和审查等专用角色,提供隔离沙箱并支持结构化通信。系统遵循定义的开发方法论(包括分析、任务规范、拉取请求创建及迭代审查),无需人工干预即可运行。在 SWE-bench 500 上的评估显示,其解决了 72.2% 的任务,优于同等模型的单智能体基线,表明复现团队结构与沟通范式是自主软件工程的关键。

AI 推荐理由

论文核心在于通过多智能体协作模拟软件工程流程,涉及复杂的任务分解、角色分配及迭代规划。

研究机构
Agyn: Mila – Quebec AI Institute (e-Lab), Tel-Aviv, Israel
论文信息
作者 Nikita Benkovich, Vitalii Valkov
发布日期 2026-02-01
arXiv ID 2602.01465
相关性评分 9/10 (高度相关)