Self-Consistency Narrative QA Reranking Robustness
摘要

叙事问答(NQA)要求模型理解长文本语境并捕捉事件关系,但现有方法多依赖单次解码,易受生成变异性影响导致答案不一致。为此,本文提出一种基于自一致性的自集成重排序框架。该方法为每个故事 - 问题对生成多个候选答案,并依据语义共识选择最终答案,无需修改底层架构即可提升鲁棒性。在 NarrativeQA 数据集上的实验表明,该策略显著提升了 FLAN-T5 和 Pegasus 等模型的性能,其中 Pegasus-Large 的提升幅度高达 14.57%。

AI 推荐理由

论文核心利用自一致性机制提升叙事问答中的推理鲁棒性与答案一致性,属推理能力研究。

研究机构
Faculty of Computer Science, MSA University, Giza, Egypt
论文信息
作者 Molham Mohamed, Ali Hamdi
发布日期 2026-06-14
arXiv ID 2606.15741
相关性评分 8/10 (高度相关)