Hallucination Audit Multi-Agent Debate Legal AI Trustworthiness
摘要

针对法律 AI 系统中高达 52% 的幻觉率及其掩盖的错误分布问题,本文提出 LegalHalluLens 审计框架。该框架包含四类法律主张的类型化幻觉档案、风险方向指数(RDI)及校准的多智能体辩论流程。实验表明,该方法能揭示聚合指标隐藏的失败模式,将虚构检测减少 45%,并以较小模型达到商业 API 水平。研究证实,基于诊断的针对性辩论优于通用辩论,为法律 AI 的可信部署提供方向感知的评估与设计支持。

AI 推荐理由

论文核心是通过多智能体辩论校准幻觉,属于提升推理可靠性的关键机制。

研究机构
Independent Researcher, Sunnyvale, CA, USA Independent Researcher, San Diego, CA, USA
论文信息
作者 Lalit Yadav, Akshaj Gurugubelli
发布日期 2026-06-16
arXiv ID 2606.18021
相关性评分 8/10 (高度相关)