Human-on-the-Loop Legal AI Error Mitigation Agentic Workflow
摘要

自主大语言模型代理在法律电子发现中应用日益广泛,但多步推理链中的累积错误可能导致法律失职。本文定义了“轨迹崩溃”现象,即早期误分类导致整个特权审查无效。主要贡献包括:提出按功能阶段组织的代理失败分类法;引入涵盖规划、推理、执行及不确定性量化的四层验证架构以拦截错误;并通过模拟研究证明,强制的人机协同升级阈值相比全自动基线能显著降低特权放弃风险,同时减少人工审查工作量。

AI 推荐理由

论文提出四层验证架构涵盖规划阶段,旨在拦截多步推理链中的级联错误,核心在于任务流程管控。

研究机构
Google LLC
论文信息
作者 Anushree Sinha, Srivaths Ranganathan, Abhishek Dharmaratnakar, Debanshu Das
发布日期 2026-06-18
arXiv ID 2606.19812
相关性评分 8/10 (高度相关)