AutoMine：面向 AV2 2026 场景挖掘挑战的解决方案

Autonomous Driving Scenario Mining Self-Refining LLM VLM

摘要

随着自动驾驶系统的发展，从大规模驾驶日志中挖掘高价值、安全关键及规划相关的场景至关重要。本文提出 AutoMine，一种基于大语言模型（LLM）和视觉语言模型（VLM）的鲁棒自优化场景挖掘方法。该方法采用语义保持的提示增强技术以降低 LLM 对提示的敏感性，结合鲁棒的轨迹原子函数与基于 VLM 的函数以应对感知噪声和开放世界视觉线索，并通过真实日志的执行反馈对生成代码进行迭代优化。在 CVPR 2026 Argoverse 2 场景挖掘竞赛中，AutoMine 取得了 36.38 的 HOTA-Temporal 分数和 77.21 的时间戳 BA 分数。

AI 推荐理由

论文提出基于执行反馈的自我 refining 机制，核心在于利用反馈循环实现代码与策略的自我改进。

研究机构

Xiaomi EV HuaZhong University of Science and Technology

论文信息

作者 Songliang Cao, Jiele Zhao, Yuru Wang, Hao Li, Daqi Liu et al.

发布日期 2026-06-10

arXiv ID 2606.11874