LLM-as-a-Judge Uncertainty Estimation Self-Refinement Human-in-the-loop
摘要

大语言模型(LLM)常被用作开放生成任务的评判者,但其偏好并非人类判断的完美代理。现有审计流程通常假设存在可靠的样本子集或干净的监督信号,这在 LLM 评估中往往不成立。本文提出 AURA,一种在有限人工验证下审计成对 LLM 评判决策的自适应不确定性感知优化框架。AURA 迭代学习人类一致性信号,传播可靠证据,并优先审查不确定的比较结果。其核心思想是将裁判的可信度视为潜在变量,随证据积累逐步优化。

AI 推荐理由

论文提出自适应优化框架,通过迭代修正提升 LLM 评判可靠性,符合自我改进与自适应进化特征。

研究机构
佐治亚州立大学数学与统计系 佐治亚州立大学概率与统计系 佐治亚州立大学计算机科学与工程系
论文信息
作者 Zilong Zhang, Yi-Ting Hung, Weiyi He, Junxi Zhang, Lei Ding et al.
发布日期 2026-06-18
arXiv ID 2606.19714
相关性评分 8/10 (高度相关)