摘要
本文针对思维链(CoT)动态,探究大语言模型(LLM)的潜在规划能力。通过提出 Tele-Lens 探测方法分析隐藏状态,发现 LLM 表现出短视视野,主要进行增量过渡而非精确的全局规划。基于此特征,作者提出增强 CoT 不确定性估计的假设,验证了少量 CoT 位置即可代表整条路径的不确定性。此外,研究强调了利用 CoT 动态的重要性,并证明可在不降低性能的情况下自动识别 CoT 绕过现象。
AI 推荐理由
论文核心研究 LLM 在思维链中的潜在规划视野与全局规划缺失机制。
研究机构
中国机构
论文信息