摘要
针对现有工具无法精准定位大语言模型智能体失败根本原因的问题,本文提出因果智能体重放(CAR)方法。该方法将智能体运行建模为结构因果模型,通过对特定步骤施加干预并重新执行轨迹,量化结果分布的变化以识别致败步骤。文章定义了步骤干预代数,提出解决随机性混淆的单步对比估计器,以及基于预算约束的蒙特卡洛 Shapley 估计器以分配交互步骤的贡献。实验验证表明,该方法能准确恢复关键步骤及多步交互效应,并提供置信区间评估。
AI 推荐理由
论文聚焦于通过因果推理定位 Agent 失败根源,核心在于提升对执行轨迹的逻辑归因能力。
研究机构
andrew.cmu.edu
论文信息