self-correction task distillation reasoning enhancement knowledge transfer
摘要

大型语言模型虽具备自我修正潜力,但现有方法多局限于表面错误修补,难以纠正深层推理缺陷。本文提出 SELF-THOUGHT 框架,在解法细化前引入任务抽象步骤,将问题蒸馏为包含关键变量与约束的结构化模板。该模板指导后续解法实例化,减少误差传播。研究表明,大模型生成的抽象模板可迁移至小模型,助其在无需重度微调或外部验证器的情况下实现可靠修正。实验证实,该方法显著提升了各类推理任务中模型的准确率、鲁棒性及泛化能力。

AI 推荐理由

论文核心提出通过任务抽象修正深层推理缺陷,显著提升推理准确性与鲁棒性。

研究机构
未提供单位
论文信息
作者 Hossein A. Rahmani, Mengting Wan, Pei Zhou, Longqi Yang, Nick Craswell et al.
发布日期 2026-01-31
arXiv ID 2602.00871
相关性评分 9/10 (高度相关)