结构化赋能大语言模型有效的错误自定位

self-correction error-localization structured-reasoning

摘要

语言模型的自我修正能力仍难以捉摸。本文探索模型能否显式定位错误推理，以构建有效自修正系统。我们提出一种提示方法，将推理结构化为离散且语义连贯的思维步骤，证明模型在此结构下能可靠定位错误，而在传统非结构化思维链中则不能。受人类大脑在决策点监控错误并重采样启发，我们提出“思维迭代修正采样”（Thought-ICS）框架。该框架引导模型逐步生成离散思维，验证后定位首个错误步骤并回溯重生成。实验显示，在有外部验证时自修正提升 20-40%，在完全自主设置下亦优于现有基线。

AI 推荐理由

论文核心研究自我修正框架，通过错误定位实现模型自主改进，属自我进化范畴。

研究机构

Meta AI 哥伦比亚大学特拉维夫大学

论文信息

作者 Ankur Samanta, Akshayaa Magesh, Ayush Jain, Kavosh Asadi, Youliang Yu et al.

发布日期 2026-02-02

arXiv ID 2602.02416