因果智能体重放：大语言模型智能体失败的反事实归因

Causal Inference Agent Debugging Counterfactual Analysis Failure Attribution

摘要

针对现有工具无法精准定位大语言模型智能体失败根本原因的问题，本文提出因果智能体重放（CAR）方法。该方法将智能体运行建模为结构因果模型，通过对特定步骤施加干预并重新执行轨迹，量化结果分布的变化以识别致败步骤。文章定义了步骤干预代数，提出解决随机性混淆的单步对比估计器，以及基于预算约束的蒙特卡洛 Shapley 估计器以分配交互步骤的贡献。实验验证表明，该方法能准确恢复关键步骤及多步交互效应，并提供置信区间评估。

AI 推荐理由

论文聚焦于通过因果推理定位 Agent 失败根源，核心在于提升对执行轨迹的逻辑归因能力。

研究机构

andrew.cmu.edu

论文信息

作者 Jaineet Shah

发布日期 2026-06-06

arXiv ID 2606.08275