LegalHalluLens：面向可信法律 AI 的类型化幻觉审计与校准多智能体辩论

Hallucination Audit Multi-Agent Debate Legal AI Trustworthiness

摘要

针对法律 AI 系统中高达 52% 的幻觉率及其掩盖的错误分布问题，本文提出 LegalHalluLens 审计框架。该框架包含四类法律主张的类型化幻觉档案、风险方向指数（RDI）及校准的多智能体辩论流程。实验表明，该方法能揭示聚合指标隐藏的失败模式，将虚构检测减少 45%，并以较小模型达到商业 API 水平。研究证实，基于诊断的针对性辩论优于通用辩论，为法律 AI 的可信部署提供方向感知的评估与设计支持。

AI 推荐理由

论文核心是通过多智能体辩论校准幻觉，属于提升推理可靠性的关键机制。

研究机构

Independent Researcher, Sunnyvale, CA, USA Independent Researcher, San Diego, CA, USA

论文信息

作者 Lalit Yadav, Akshaj Gurugubelli

发布日期 2026-06-16

arXiv ID 2606.18021