摘要
大型语言模型在论证挖掘中表现优异,但无训练模型常忽略复杂细节且自我修正易加剧幻觉。本文扩展了支持者 - 反对者 - 裁判的多智能体辩论框架,将其应用于论证关系识别任务,并引入置信度门控机制,仅对不确定案例进行辩论。实验表明,选择性辩论在无训练方法中取得了最高的 Macro F1 值,优于微调模型,同时提供了可解释的辩论记录,有效提升了推理准确性与透明度。
AI 推荐理由
论文核心利用多智能体辩论机制提升 LLM 在论证关系识别中的推理能力,解决幻觉问题。
研究机构
Faculty of Electronics and Information Technology, Warsaw University of Technology, Poland
论文信息