摘要
随着自动驾驶系统的发展,从大规模驾驶日志中挖掘高价值、安全关键及规划相关的场景至关重要。本文提出 AutoMine,一种基于大语言模型(LLM)和视觉语言模型(VLM)的鲁棒自优化场景挖掘方法。该方法采用语义保持的提示增强技术以降低 LLM 对提示的敏感性,结合鲁棒的轨迹原子函数与基于 VLM 的函数以应对感知噪声和开放世界视觉线索,并通过真实日志的执行反馈对生成代码进行迭代优化。在 CVPR 2026 Argoverse 2 场景挖掘竞赛中,AutoMine 取得了 36.38 的 HOTA-Temporal 分数和 77.21 的时间戳 BA 分数。
AI 推荐理由
论文提出基于执行反馈的自我 refining 机制,核心在于利用反馈循环实现代码与策略的自我改进。
研究机构
Xiaomi EV
HuaZhong University of Science and Technology
论文信息