Chain-of-Thought Planning Horizon Uncertainty Estimation LLM Internals
摘要

本文针对思维链(CoT)动态,探究大语言模型(LLM)的潜在规划能力。通过提出 Tele-Lens 探测方法分析隐藏状态,发现 LLM 表现出短视视野,主要进行增量过渡而非精确的全局规划。基于此特征,作者提出增强 CoT 不确定性估计的假设,验证了少量 CoT 位置即可代表整条路径的不确定性。此外,研究强调了利用 CoT 动态的重要性,并证明可在不降低性能的情况下自动识别 CoT 绕过现象。

AI 推荐理由

论文核心研究 LLM 在思维链中的潜在规划视野与全局规划缺失机制。

研究机构
中国机构
论文信息
作者 Liyan Xu, Mo Yu, Fandong Meng, Jie Zhou
发布日期 2026-02-02
arXiv ID 2602.02103
相关性评分 9/10 (高度相关)