摘要
使大型语言模型整合新知识并在推理中灵活应用仍具挑战。现有知识编辑方法侧重原子事实,虽提升事实召回率,却难以将新信息融入跨上下文的连贯框架。本文主张知识内化本质上是推理而非记忆问题,提出一种训练策略:首先,将新知识作为连贯的背景故事引入;其次,利用涉及新信息的多跳自生成问题进行多步推理训练;最后,通过知识蒸馏迫使学生在无新知识访问下内化教师的推理行为。实验表明,该策略能有效提升模型在结合多个新事实的复杂推理任务中的表现。
AI 推荐理由
论文核心主张知识内化是推理问题,提出基于多步推理的训练策略,深度聚焦推理机制。
研究机构
Amazon.com, Work done while at Aalto University, 'System 2 AI'
论文信息