摘要
语言模型代理在工具调用失败后常表现出自我恢复能力,但缺乏形式化解释。本文提出预测理论,通过期望恢复遗憾(ERR)量化恢复策略与最优策略的偏差,并推导其与效率分数(ES)的一阶关系,确立了工具使用代理恢复动力学的首个可证伪定量定律。在五个基准上的实证表明,该定律能高精度预测失败后的遗憾值。结果揭示可恢复性是交互动态的受控属性,为语言代理的执行级鲁棒性奠定了理论基础。
AI 推荐理由
论文核心研究工具增强型代理在调用失败后的自我恢复机制,直接关联技能执行的鲁棒性。
研究机构
Missing \vcmfiliation
论文信息