摘要
思维链(CoT)虽赋能大模型解决复杂问题,但受限于离散令牌空间的计算成本及推理路径坍塌。现有潜在推理方法虽提升效率,却常表现为不透明的端到端映射且需预设步数。本文提出 PLaT 框架,通过将推理建模为潜在规划状态的确定性轨迹,并将言语化交由独立解码器处理,从根本上解耦了推理与表达。该方法允许模型动态决定推理终止时机。实验表明,PLaT 在贪婪准确率上略低,但在推理多样性和可扩展性上显著优于基线,为推理时搜索提供了透明且鲁棒的基础。
AI 推荐理由
论文将潜在推理重构为规划问题,核心贡献在于解耦推理与表达,实现动态规划终止。
研究机构
北京航空航天大学
论文信息