self-correction error-localization structured-reasoning
摘要

语言模型的自我修正能力仍难以捉摸。本文探索模型能否显式定位错误推理,以构建有效自修正系统。我们提出一种提示方法,将推理结构化为离散且语义连贯的思维步骤,证明模型在此结构下能可靠定位错误,而在传统非结构化思维链中则不能。受人类大脑在决策点监控错误并重采样启发,我们提出“思维迭代修正采样”(Thought-ICS)框架。该框架引导模型逐步生成离散思维,验证后定位首个错误步骤并回溯重生成。实验显示,在有外部验证时自修正提升 20-40%,在完全自主设置下亦优于现有基线。

AI 推荐理由

论文核心研究自我修正框架,通过错误定位实现模型自主改进,属自我进化范畴。

研究机构
Meta AI 哥伦比亚大学 特拉维夫大学
论文信息
作者 Ankur Samanta, Akshayaa Magesh, Ayush Jain, Kavosh Asadi, Youliang Yu et al.
发布日期 2026-02-02
arXiv ID 2602.02416
相关性评分 9/10 (高度相关)