大型推理模型的条件性能保证

Chain-of-Thought PAC Learning Efficient Reasoning Risk Control

摘要

大型推理模型虽通过扩展思维链展现出强大性能，但计算成本高昂。现有近似正确（PAC）推理仅提供边缘情况下的统计保证，缺乏精确的条件覆盖。本文提出 G-PAC 推理框架，通过划分输入空间在组级别提供 PAC 风格保证。我们开发了两种实例：针对已知分组结构的 Group PAC 和针对未知分组的 Clustered PAC。理论证明两者均能实现组条件风险控制，且在异构设置下比边缘 PAC 推理更高效。实验表明，该方法在显著节省计算资源的同时，成功实现了组条件风险控制。

AI 推荐理由

论文核心研究大推理模型的思维链效率与统计保证，直接针对推理机制优化。

研究机构

南方科技大学深圳, 中国

论文信息

作者 Jianguo Huang, Hao Zeng, Bingyi Jing, Hongxin Wei, Bo An

发布日期 2026-01-30

arXiv ID 2601.22790