Parallel-Probe：通过二维探测迈向高效并行思维

parallel thinking inference efficiency test-time scaling consensus mechanism

摘要

并行思维作为一种新兴的推理范式，虽具潜力但计算负担沉重。现有方法多依赖局部信号，缺乏利用并行分支全局动态的机制。本文提出“二维探测”接口，通过周期性获取各分支中间答案来揭示宽度 - 深度动态。基于发现的非单调缩放、分支长度异构及共识早期稳定等洞察，我们设计了无需训练的控制器 Parallel-Probe。该控制器利用基于共识的早停机制调节推理深度，并通过基于偏差的剪枝动态调整宽度。实验表明，该方法在保持竞争力的同时，显著降低了令牌消耗，确立了更优的测试时扩展帕累托前沿。

AI 推荐理由

论文核心研究并行思维推理范式，提出优化机制以提升推理效率与成本效益。

研究机构

中国科学院

论文信息

作者 Tong Zheng, Chengsong Huang, Runpeng Dai, Yun He, Rui Liu et al.

发布日期 2026-02-03

arXiv ID 2602.03845