Autonomous Driving Scenario Mining Self-Refining LLM VLM
摘要

随着自动驾驶系统的发展,从大规模驾驶日志中挖掘高价值、安全关键及规划相关的场景至关重要。本文提出 AutoMine,一种基于大语言模型(LLM)和视觉语言模型(VLM)的鲁棒自优化场景挖掘方法。该方法采用语义保持的提示增强技术以降低 LLM 对提示的敏感性,结合鲁棒的轨迹原子函数与基于 VLM 的函数以应对感知噪声和开放世界视觉线索,并通过真实日志的执行反馈对生成代码进行迭代优化。在 CVPR 2026 Argoverse 2 场景挖掘竞赛中,AutoMine 取得了 36.38 的 HOTA-Temporal 分数和 77.21 的时间戳 BA 分数。

AI 推荐理由

论文提出基于执行反馈的自我 refining 机制,核心在于利用反馈循环实现代码与策略的自我改进。

研究机构
Xiaomi EV HuaZhong University of Science and Technology
论文信息
作者 Songliang Cao, Jiele Zhao, Yuru Wang, Hao Li, Daqi Liu et al.
发布日期 2026-06-10
arXiv ID 2606.11874
相关性评分 8/10 (高度相关)