Chain-of-Thought PAC Learning Efficient Reasoning Risk Control
摘要

大型推理模型虽通过扩展思维链展现出强大性能,但计算成本高昂。现有近似正确(PAC)推理仅提供边缘情况下的统计保证,缺乏精确的条件覆盖。本文提出 G-PAC 推理框架,通过划分输入空间在组级别提供 PAC 风格保证。我们开发了两种实例:针对已知分组结构的 Group PAC 和针对未知分组的 Clustered PAC。理论证明两者均能实现组条件风险控制,且在异构设置下比边缘 PAC 推理更高效。实验表明,该方法在显著节省计算资源的同时,成功实现了组条件风险控制。

AI 推荐理由

论文核心研究大推理模型的思维链效率与统计保证,直接针对推理机制优化。

研究机构
南方科技大学深圳, 中国
论文信息
作者 Jianguo Huang, Hao Zeng, Bingyi Jing, Hongxin Wei, Bo An
发布日期 2026-01-30
arXiv ID 2601.22790
相关性评分 9/10 (高度相关)