JAF：法官代理森林

Self-Refinement Judge Agent Ensemble Learning Cloud Misconfigs

摘要

本文提出法官代理森林（JAF）框架，旨在通过联合推断一批查询 - 响应配对，而非孤立评估，来提升法官代理的能力。该范式使法官从局部评估者转变为整体学习者，通过识别跨实例模式与不一致性，提供聚合反馈以驱动主代理的自我完善。概念上，JAF 融合信念传播与集成学习原理，利用上下文邻域构建知识图谱以传播批评。此外，作者开发了一种灵活的局部敏感哈希算法，整合语义嵌入与大模型驱动谓词，以优化思维链路径的探索与多样样本选择，并在云配置错误分类任务中验证了其有效性。

AI 推荐理由

论文核心在于通过法官代理的集体反馈机制，实现主代理的迭代自我完善与推理优化。

研究机构

Averlon AI Research

论文信息

作者 Sahil Garg, Brad Cheezum, Sridhar Dutta, Vishal Agarwal

发布日期 2026-01-29

arXiv ID 2601.22269