Small Language Models Code Agents Repository-Centric Learning Software Engineering
摘要

针对隐私敏感及资源受限环境下对开源小语言模型(SLM)的需求,本文指出其缺乏处理复杂陌生代码库的泛化能力。作者提出“以仓库为中心的学习”(RCL)范式,取代传统的任务中心学习,主张通过参数化知识内化软件环境规律。基于此设计的四单元交互学习机制,训练出 SWE-Spot-4B 模型系列。实验表明,该模型在多项软件工程任务中超越更大规模的开源模型及部分商业模型,显著提升了训练样本效率并降低了推理成本。

AI 推荐理由

论文核心在于提升小模型在复杂代码库中的编码与工具使用技能,通过新范式解决能力差距。

研究机构
哥伦比亚大学计算机科学系,美国纽约
论文信息
作者 Jinjun Peng, Magnus Saebo, Tianjun Zhong, Yi-Jie Cheng, Junfeng Yang et al.
发布日期 2026-01-29
arXiv ID 2601.21649
相关性评分 9/10 (高度相关)