摘要
大规模高质量交互轨迹对推进移动图形界面(GUI)代理至关重要。现有方法缺乏对任务难度的细粒度控制,导致训练难度与代理能力不匹配。受人类渐进式学习启发,本文提出 MobileGen 框架,将任务难度解耦为结构与语义维度,评估代理能力边界并自适应计算难度分布。基于采样难度,利用多智能体生成器合成高质量交互轨迹。实验表明,该方法在多个基准测试中将代理平均性能提升了 1.57 倍,证明了能力对齐数据生成的有效性。
AI 推荐理由
论文核心在于通过自适应难度数据生成提升移动 GUI Agent 的技能学习效果,直接针对技能训练机制。
研究机构
天津大学
论文信息