GUI Agent Backtracking Adaptive Planning Task Execution
摘要

GUI 智能体旨在自动化重复任务以提升效率,但现有方法一旦陷入错误探索路径往往难以恢复,导致任务失败。本文将 GUI 任务执行建模为深度优先搜索(DFS)过程,提出 BEAP-Agent 框架。该框架支持长程、多层级的状态回溯,结合动态任务跟踪与更新机制,由规划器、执行器和跟踪器三个协同组件构成,有效实现了任务的探索与执行。在 OSWorld 基准上的评估显示,该方法准确率达到 28.2%,验证了其在长程任务探索中的有效性。

AI 推荐理由

论文提出自适应规划框架,核心解决长程任务中的回溯与动态规划问题。

研究机构
广东工业大学人工智能与数字经济实验室(SZ), 中国 深圳大学, 中国
论文信息
作者 Ziyu Lu, Tengjin Weng, Yiying Yang, Yuhang Zhao, Xinxin Huang et al.
发布日期 2026-01-29
arXiv ID 2601.21352
相关性评分 9/10 (高度相关)