摘要
深度研究代理可以在几分钟内生成流畅的科学报告;然而,仔细阅读后发现,真正的成本并非阅读本身,而是追溯:哪句话由哪个段落支持,哪些内容被忽略,以及证据之间存在冲突。我们认为,随着研究生成变得容易,可审计性成为瓶颈,主要风险也从孤立的事实错误转变为具有科学风格但声明-证据联系薄弱、缺失或误导的输出。本文提出声明级可审计性作为深度研究代理设计和评估的核心目标,总结了长期失败模式(目标漂移、瞬时约束和不可验证推理),并引入了可审计自主研究(AAR)标准,这是一个紧凑的度量框架,通过溯源覆盖率、溯源正确性、矛盾透明性和审计努力来测试可审计性。我们还主张使用语义溯源与协议化验证:持久且可查询的溯源图谱,编码声明-证据关系(包括冲突),并在合成过程中而非发布后进行持续验证,并提供实用的仪器模式以支持大规模部署。
AI 推荐理由
论文聚焦于研究代理的可审计性,涉及证据追踪与溯源,与Agent Memory相关但非唯一主题。
论文信息