机器人学习 任务生成 智能体框架 VLA预训练
摘要

通用机器人操作的研究受到现实世界交互数据稀缺性的阻碍。与视觉或语言领域从网络收集数据不同,机器人数据收集是一个主动过程,成本高昂。因此,如何自动化地生成多样化且物理可行的任务成为关键挑战。本文提出RoboGene,一个智能体框架,用于自动生成适用于单臂、双臂和移动机器人的多样化、物理上可行的操作任务。该框架包含三个核心组件:多样性驱动的采样以覆盖广泛任务、自我反思机制以确保物理约束,以及人机协作的持续优化。我们进行了大量定量分析和大规模现实实验,收集了18,000条轨迹的数据集,并引入了新的评估指标来衡量任务质量、可行性和多样性。结果表明,RoboGene显著优于最先进的基础模型(如GPT-4o、Gemini 2.5 Pro)。此外,使用RoboGene预训练的VLA模型在现实任务中表现出更高的成功率和更好的泛化能力,突显了高质量任务生成的重要性。

AI 推荐理由

论文涉及任务生成与数据多样性,间接关联记忆机制,但非核心研究内容。

论文信息
作者 Yixue Zhang, Kun Wu, Zhi Gao, Zhen Zhao, Pei Ren et al.
发布日期 2026-02-18
arXiv ID 2602.16444
相关性评分 5/10 (一般相关)