adaptive reasoning risk control compute efficiency conformal prediction
摘要

推理大语言模型支持测试时扩展,但自适应推理中的令牌预算设定面临风险与准确率的权衡挑战。本文将该问题重构为风险控制任务,旨在限制错误率的同时最小化计算消耗。框架引入置信度上限阈值以停止充分推理,并提出新颖的参数化下限阈值以提前终止无解实例。利用无分布风险控制方法,根据目标风险和验证集优化设定这些停止机制。实验表明,该方法在遵守用户指定风险目标的同时,显著提升了多样推理任务中的计算效率。

AI 推荐理由

论文核心研究推理过程中的计算预算控制与风险权衡,直接优化推理机制。

研究机构
Johns Hopkins University, Baltimore, Maryland, USA
论文信息
作者 Xi Wang, Anushri Suresh, Alvin Zhang, Rishi More, William Jurayj et al.
发布日期 2026-02-03
arXiv ID 2602.03814
相关性评分 9/10 (高度相关)