摘要
大型多模态推理模型通过显式长链推理解决视觉难题,但易产生幻觉。本文识别出“推理漂移”现象,即模型在收集线索时过度关注无关实体,导致推理轨迹与视觉基础脱节。为此,作者提出 ClueRecall 评估指标及 ClueTracer 方法。这是一种免训练、无参数且架构无关的插件,通过从问题出发追踪关键线索在推理路径中的传播,定位任务相关区域并抑制虚假注意力。实验表明,该方法显著提升了各类推理及非推理架构的性能。
AI 推荐理由
论文核心解决多模态推理中的幻觉与推理漂移问题,直接提升推理能力。
研究机构
北京邮电大学
论文信息