Chain-of-Thought Latent Reasoning Efficiency Mathematical Reasoning
摘要

思维链(CoT)是提升大语言模型推理能力的关键技术,而潜在推理方法旨在加速低效的令牌级推理链。针对现有方法需增强模型结构且训练成本高的问题,本文提出 CoLT 框架,将潜在推理实现为“工具调用”。该框架生成包含推理步骤信息的种子令牌,触发时由小型外部模型利用隐藏状态将其还原为完整推理步。此举确保主模型在显式令牌空间推理,既保留能力又提升效率。在四个数学数据集上的实验表明,CoLT 相比基线具有更高准确率和更短推理长度,且兼容强化学习算法及不同解码器结构。

AI 推荐理由

论文提出 CoLT 框架,通过潜在工具调用优化思维链推理效率与精度,核心聚焦推理机制。

研究机构
北京大学计算机学院 北京大学多媒体信息处理重点实验室
论文信息
作者 Fangwei Zhu, Zhifang Sui
发布日期 2026-02-04
arXiv ID 2602.04246
相关性评分 9/10 (高度相关)