Agent Landslide Identification Domain Rules Multimodal Learning
摘要

针对现有范式难以同时提取视觉特征与高层地学语义,以及通用视觉语言模型在复杂地质场景中存在的感知局限和幻觉问题,本文提出了一种指令驱动的代理框架。该框架包含三个核心组件:首先,构建多模态细粒度数据集 LandslideBench;其次,微调面向滑坡的视觉语言模型 LandslideVLM 以增强地学语义理解;最后,开发领域规则增强的 LandslideAgent,利用双重规则控制器规范自动化工具调用,实现自主多源空间数据推理。实验表明,该方法显著提升了滑坡判别、细粒度分类及语义描述质量,实现了滑坡识别与分析的全流程智能化。

AI 推荐理由

论文提出基于规则增强的 Agent,通过双重规则控制器规划工具调用,实现自主多源数据推理与分析。

研究机构
School of Geosciences and Info-Physics, Central South University
论文信息
作者 Chengfu Liu, Dongyang Hou, Junwu Xiang, Cheng Yang, Xuezhi Cui et al.
发布日期 2026-06-17
arXiv ID 2606.18661
相关性评分 8/10 (高度相关)