TraceCoder：一种用于 LLM 生成代码自动调试的轨迹驱动多智能体框架

Automated Debugging Multi-Agent System Self-Improvement Code Repair

摘要

针对大语言模型生成代码存在隐蔽错误且现有修复方法缺乏深层行为洞察的问题，本文提出 TraceCoder 框架。该框架模拟人类专家的观察 - 分析 - 修复过程，通过植入诊断探针捕获细粒度运行时轨迹以定位根因。其核心创新在于引入历史教训学习机制，从既往失败中提取经验指导后续策略，并结合回滚机制确保每次迭代严格优化。实验表明，该方法在 Pass@1 准确率上较先进基线提升 34.43%，显著优于现有迭代方法。

AI 推荐理由

论文核心在于通过历史教训学习机制和回滚机制实现 Agent 的自我反思与迭代修复，属于典型的自我进化研究。

研究机构

重庆邮电大学计算机科学与技术学院南洋理工大学北京邮电大学西南大学

论文信息

作者 Jiangping Huang, Wenguang Ye, Weisong Sun, Jian Zhang, Mingyue Zhang et al.

发布日期 2026-02-06

arXiv ID 2602.06875