摘要
本文研究了“上下文拖拽”现象,即上下文中存在的失败尝试会诱导后续生成产生结构相似的错误。通过对 11 个模型在 8 项推理任务上的评估,发现该现象导致性能下降 10-20%,严重时可致自我优化退化为自我恶化。结构分析表明,后续推理轨迹继承了上下文中的错误模式。研究显示,外部反馈或自我验证均无法完全消除此效应,现有缓解策略仅能部分改善,表明这是当前推理架构中持久的失效模式。
AI 推荐理由
论文核心研究上下文错误如何直接削弱 LLM 推理能力,揭示结构性错误传播机制。
研究机构
中国机构未明确标注
论文信息