AURA：用于 LLM 即裁判审计的自适应不确定性感知优化

LLM-as-a-Judge Uncertainty Estimation Self-Refinement Human-in-the-loop

摘要

大语言模型（LLM）常被用作开放生成任务的评判者，但其偏好并非人类判断的完美代理。现有审计流程通常假设存在可靠的样本子集或干净的监督信号，这在 LLM 评估中往往不成立。本文提出 AURA，一种在有限人工验证下审计成对 LLM 评判决策的自适应不确定性感知优化框架。AURA 迭代学习人类一致性信号，传播可靠证据，并优先审查不确定的比较结果。其核心思想是将裁判的可信度视为潜在变量，随证据积累逐步优化。

AI 推荐理由

论文提出自适应优化框架，通过迭代修正提升 LLM 评判可靠性，符合自我改进与自适应进化特征。

研究机构

佐治亚州立大学数学与统计系佐治亚州立大学概率与统计系佐治亚州立大学计算机科学与工程系

论文信息

作者 Zilong Zhang, Yi-Ting Hung, Weiyi He, Junxi Zhang, Lei Ding et al.

发布日期 2026-06-18

arXiv ID 2606.19714