摘要
针对法律 AI 系统中高达 52% 的幻觉率及其掩盖的错误分布问题,本文提出 LegalHalluLens 审计框架。该框架包含四类法律主张的类型化幻觉档案、风险方向指数(RDI)及校准的多智能体辩论流程。实验表明,该方法能揭示聚合指标隐藏的失败模式,将虚构检测减少 45%,并以较小模型达到商业 API 水平。研究证实,基于诊断的针对性辩论优于通用辩论,为法律 AI 的可信部署提供方向感知的评估与设计支持。
AI 推荐理由
论文核心是通过多智能体辩论校准幻觉,属于提升推理可靠性的关键机制。
研究机构
Independent Researcher, Sunnyvale, CA, USA
Independent Researcher, San Diego, CA, USA
论文信息