通过背景故事上的多步推理编辑知识，而不仅仅是事实

Knowledge Editing Multi-step Reasoning Knowledge Distillation LLM Training

摘要

使大型语言模型整合新知识并在推理中灵活应用仍具挑战。现有知识编辑方法侧重原子事实，虽提升事实召回率，却难以将新信息融入跨上下文的连贯框架。本文主张知识内化本质上是推理而非记忆问题，提出一种训练策略：首先，将新知识作为连贯的背景故事引入；其次，利用涉及新信息的多跳自生成问题进行多步推理训练；最后，通过知识蒸馏迫使学生在无新知识访问下内化教师的推理行为。实验表明，该策略能有效提升模型在结合多个新事实的复杂推理任务中的表现。

AI 推荐理由

论文核心主张知识内化是推理问题，提出基于多步推理的训练策略，深度聚焦推理机制。

研究机构

Amazon.com, Work done while at Aalto University, 'System 2 AI'

论文信息

作者 Ya Gao, Kalle Kujanpää, Pekka Marttinen, Harri Valpola, Alexander Ilin

发布日期 2026-02-02

arXiv ID 2602.02028