摘要
并行思维作为一种新兴的推理范式,虽具潜力但计算负担沉重。现有方法多依赖局部信号,缺乏利用并行分支全局动态的机制。本文提出“二维探测”接口,通过周期性获取各分支中间答案来揭示宽度 - 深度动态。基于发现的非单调缩放、分支长度异构及共识早期稳定等洞察,我们设计了无需训练的控制器 Parallel-Probe。该控制器利用基于共识的早停机制调节推理深度,并通过基于偏差的剪枝动态调整宽度。实验表明,该方法在保持竞争力的同时,显著降低了令牌消耗,确立了更优的测试时扩展帕累托前沿。
AI 推荐理由
论文核心研究并行思维推理范式,提出优化机制以提升推理效率与成本效益。
研究机构
中国科学院
论文信息