大语言模型在推理时规划中可能迈出错误的第一步

inference-time planning Bayesian account planning shift LLM behavior

摘要

大语言模型（LLM）虽在训练中习得序列级规划能力，但其推理时的规划行为常显短视且不一致。本文提出一种贝叶斯解释，将规划行为植根于不断演化的生成上下文中：由于自然语言与 LLM 内化语言的细微差异，累积的自生成上下文驱动了推理过程中的“规划偏移”，导致规划能力受损的表象。通过随机生成和高斯采样两项受控实验，验证了该模型，揭示了自生成序列如何影响初始偏差及规划强度，为表征 LLM 推理时的前瞻规划提供了理论解释与实证依据。

AI 推荐理由

论文核心研究 LLM 在推理时的规划行为偏差及其贝叶斯解释，直接针对规划机制。

研究机构

心理学系，华威大学心理学系，香港大学

论文信息

作者 Haijiang Yan, Jian-Qiao Zhu, Adam Sanborn

发布日期 2026-02-03

arXiv ID 2602.02991