SWE Agent Code Understanding Behavioral Analysis Observability
摘要

软件工程代理(SWE Agents)在真实仓库中的工具介导轨迹难以具体表征。本文提出 Ada,一种用于仓库级代码理解的限定装置,通过有界工具接口进入真实代码库,将开放式探索记录为有限轨迹。研究引入多种“观察透镜”来投射 Ada 的思维 - 行动链,使导航、证据选择、综合、 grounding 及停止决策可见,而非仅统计工具调用。通过对 408 条轨迹的分析,揭示了不同模型在效率、轨迹多样性及认识论基础上的差异,为观察真实代码库中的 SWE 代理行为提供了方法论基础。

AI 推荐理由

论文聚焦于通过观察透镜分析 Agent 的推理链、证据选择及认知基础,虽非纯推理算法,但核心在于解析思维过程。

研究机构
中国科学院自动化研究所
论文信息
作者 Zhengyi Zhuo, Yan Liu
发布日期 2026-06-07
arXiv ID 2606.08500
相关性评分 8/10 (高度相关)