Multimodal Large Language Models Remote Sensing Reasoning Benchmark
摘要

近期多模态大语言模型(MLLMs)在复杂推理方面取得进展,但现有遥感基准仍严重偏向物体识别等感知任务,限制了其在高认知需求应用中的发展。为此,本文提出 VLRS-Bench,这是首个专用于复杂遥感推理的基准。该基准涵盖认知、决策和预测三个核心维度,包含 2000 个问答对,涉及 14 项任务及多达八个时间阶段。通过整合遥感先验与专家知识构建,实验揭示了当前最先进 MLLMs 的显著瓶颈,为社区推进多模态推理提供了关键洞察。

AI 推荐理由

论文提出首个遥感复杂推理基准,核心评估多模态模型的认知与推理能力。

研究机构
武汉大学计算机学院 中国科学院遥感与数字地球研究所
论文信息
作者 Zhiming Luo, Di Wang, Haonan Guo, Jing Zhang, Bo Du
发布日期 2026-02-04
arXiv ID 2602.07045
相关性评分 9/10 (高度相关)