VLRS-Bench：一个用于遥感的视觉 - 语言推理基准

Multimodal Large Language Models Remote Sensing Reasoning Benchmark

摘要

近期多模态大语言模型（MLLMs）在复杂推理方面取得进展，但现有遥感基准仍严重偏向物体识别等感知任务，限制了其在高认知需求应用中的发展。为此，本文提出 VLRS-Bench，这是首个专用于复杂遥感推理的基准。该基准涵盖认知、决策和预测三个核心维度，包含 2000 个问答对，涉及 14 项任务及多达八个时间阶段。通过整合遥感先验与专家知识构建，实验揭示了当前最先进 MLLMs 的显著瓶颈，为社区推进多模态推理提供了关键洞察。

AI 推荐理由

论文提出首个遥感复杂推理基准，核心评估多模态模型的认知与推理能力。

研究机构

武汉大学计算机学院中国科学院遥感与数字地球研究所

论文信息

作者 Zhiming Luo, Di Wang, Haonan Guo, Jing Zhang, Bo Du

发布日期 2026-02-04

arXiv ID 2602.07045