inference-time planning Bayesian account planning shift LLM behavior
摘要

大语言模型(LLM)虽在训练中习得序列级规划能力,但其推理时的规划行为常显短视且不一致。本文提出一种贝叶斯解释,将规划行为植根于不断演化的生成上下文中:由于自然语言与 LLM 内化语言的细微差异,累积的自生成上下文驱动了推理过程中的“规划偏移”,导致规划能力受损的表象。通过随机生成和高斯采样两项受控实验,验证了该模型,揭示了自生成序列如何影响初始偏差及规划强度,为表征 LLM 推理时的前瞻规划提供了理论解释与实证依据。

AI 推荐理由

论文核心研究 LLM 在推理时的规划行为偏差及其贝叶斯解释,直接针对规划机制。

研究机构
心理学系,华威大学 心理学系,香港大学
论文信息
作者 Haijiang Yan, Jian-Qiao Zhu, Adam Sanborn
发布日期 2026-02-03
arXiv ID 2602.02991
相关性评分 9/10 (高度相关)