摘要
近期多模态大语言模型(MLLMs)在复杂推理方面取得进展,但现有遥感基准仍严重偏向物体识别等感知任务,限制了其在高认知需求应用中的发展。为此,本文提出 VLRS-Bench,这是首个专用于复杂遥感推理的基准。该基准涵盖认知、决策和预测三个核心维度,包含 2000 个问答对,涉及 14 项任务及多达八个时间阶段。通过整合遥感先验与专家知识构建,实验揭示了当前最先进 MLLMs 的显著瓶颈,为社区推进多模态推理提供了关键洞察。
AI 推荐理由
论文提出首个遥感复杂推理基准,核心评估多模态模型的认知与推理能力。
研究机构
武汉大学计算机学院
中国科学院遥感与数字地球研究所
论文信息