超越输出批判：通过任务蒸馏实现自我修正

self-correction task distillation reasoning enhancement knowledge transfer

摘要

大型语言模型虽具备自我修正潜力，但现有方法多局限于表面错误修补，难以纠正深层推理缺陷。本文提出 SELF-THOUGHT 框架，在解法细化前引入任务抽象步骤，将问题蒸馏为包含关键变量与约束的结构化模板。该模板指导后续解法实例化，减少误差传播。研究表明，大模型生成的抽象模板可迁移至小模型，助其在无需重度微调或外部验证器的情况下实现可靠修正。实验证实，该方法显著提升了各类推理任务中模型的准确率、鲁棒性及泛化能力。

AI 推荐理由

论文核心提出通过任务抽象修正深层推理缺陷，显著提升推理准确性与鲁棒性。

研究机构

未提供单位

论文信息

作者 Hossein A. Rahmani, Mengting Wan, Pei Zhou, Longqi Yang, Nick Craswell et al.

发布日期 2026-01-31

arXiv ID 2602.00871