Agent Memory Experience Intervention Web Agents Entropy-based Triggering
摘要

在Web代理中引入经验干预被视为一种有前景的技术范式,通过从积累的经验中提取有价值的信息来增强代理的交互能力。然而,现有方法主要在任务执行前被动地将经验作为全局上下文注入,难以适应代理与环境交互过程中动态变化的上下文观察。本文提出ExpSeek方法,将经验向步骤级别的主动探索转变:(1)利用模型的内在信号估计步骤级熵阈值以确定干预时机;(2)设计步骤级定制化的经验内容。在Qwen3-8B和32B模型上进行的四组具有挑战性的Web代理基准测试表明,ExpSeek分别实现了9.3%和7.5%的绝对性能提升。实验验证了熵作为自触发信号的可行性和优势,并揭示了即使使用4B的小规模经验模型,也能显著提升大型代理模型的性能。

AI 推荐理由

论文提出ExpSeek方法,涉及基于经验的主动干预机制,与Agent Memory相关但非唯一主题。

论文信息
作者 Wenyuan Zhang, Xinghua Zhang, Haiyang Yu, Shuaiyi Nie, Bingli Wu et al.
发布日期 2026-01-13
arXiv ID 2601.08605
相关性评分 7/10 (相关)