多智能体协作中用于高效优化代码生成的自适应置信度门控

Multi-Agent Collaboration Code Generation Small Language Models Reasoning Enhancement

摘要

针对小语言模型在处理复杂逻辑需求时面临的推理瓶颈与失败循环问题，本文提出 DebateCoder，一种专为资源受限环境设计的多智能体协作框架。该框架采用包含用户、技术及质量保证角色的结构化扮演协议，并引入自适应置信度门控机制以平衡准确率与推理效率。通过多轮审议模块及评审引导的分析调试循环，实现生成前辩论与生成后优化。实验表明，该方法在 HumanEval 上显著优于基线，有效缓解了小规模模型的局限性。

AI 推荐理由

论文核心旨在通过多智能体辩论机制解决小模型推理瓶颈，显著提升逻辑推理能力。

研究机构

中国电子科学与技术大学

论文信息

作者 Haoji Zhang, Yuzhe Li, Zhenqiang Liu, Chenyang Liu, Shenyang Zhang et al.

发布日期 2026-01-29

arXiv ID 2601.21469