元认知监控 深度搜索 推理鲁棒性 认知神经科学启发
摘要

大型语言模型驱动的深度搜索代理在多步检索与长程任务中表现优异,但常因缺乏对不确定环境下推理状态的监控机制而失败。本文受认知神经科学启发,提出具有显式分层元认知监控机制的 DS-MCM 框架。该框架集成“快速一致性监控器”进行轻量级证据对齐检查,并选择性激活“慢速经验驱动监控器”,利用历史轨迹记忆指导纠正干预。实验表明,该方法显著提升了多基准下的性能与鲁棒性。

AI 推荐理由

提出分层元认知监控机制,直接调节推理与检索状态,显著提升多步推理鲁棒性。

研究机构
国科大人工智能学院 信息科技与管理学院 对外经济贸易大学 腾讯搜索应用部 北京邮电大学邮政与电信学院
论文信息
作者 Zhongxiang Sun, Qipeng Wang, Weijie Yu, Jingxuan Yang, Haolang Lu et al.
发布日期 2026-01-30
arXiv ID 2601.23188
相关性评分 9/10 (高度相关)