Multimodal Reasoning Hallucination Suppression Visual Grounding Reasoning Drift
摘要

大型多模态推理模型通过显式长链推理解决视觉难题,但易产生幻觉。本文识别出“推理漂移”现象,即模型在收集线索时过度关注无关实体,导致推理轨迹与视觉基础脱节。为此,作者提出 ClueRecall 评估指标及 ClueTracer 方法。这是一种免训练、无参数且架构无关的插件,通过从问题出发追踪关键线索在推理路径中的传播,定位任务相关区域并抑制虚假注意力。实验表明,该方法显著提升了各类推理及非推理架构的性能。

AI 推荐理由

论文核心解决多模态推理中的幻觉与推理漂移问题,直接提升推理能力。

研究机构
北京邮电大学
论文信息
作者 Gongli Xi, Kun Wang, Zeming Gao, Huahui Yi, Haolang Lu et al.
发布日期 2026-02-02
arXiv ID 2602.02004
相关性评分 9/10 (高度相关)