摘要
自主大语言模型代理在法律电子发现中应用日益广泛,但多步推理链中的累积错误可能导致法律失职。本文定义了“轨迹崩溃”现象,即早期误分类导致整个特权审查无效。主要贡献包括:提出按功能阶段组织的代理失败分类法;引入涵盖规划、推理、执行及不确定性量化的四层验证架构以拦截错误;并通过模拟研究证明,强制的人机协同升级阈值相比全自动基线能显著降低特权放弃风险,同时减少人工审查工作量。
AI 推荐理由
论文提出四层验证架构涵盖规划阶段,旨在拦截多步推理链中的级联错误,核心在于任务流程管控。
研究机构
Google LLC
论文信息