摘要
理解否定句含义仍是语言模型面临的挑战之一。本文从行为系统性和表征系统性两个视角分析了大语言模型(LLM)对否定的理解。在行为层面,证实通过演示和上下文学习,LLM 能一定程度上识别否定表达及其作用范围,但无法达到完美性能,且难度受输出格式影响。在表征层面,分析了能否从上下文示例中稳健构建用于否定理解的任务函数向量。实验表明,虽可组合提取否定线索的函数向量,但识别作用范围的向量构建更具挑战性。
AI 推荐理由
论文核心研究 LLM 对否定句的逻辑理解与范围识别,属于基础推理能力范畴。
研究机构
The University of Tokyo
Riken
Tohoku University
论文信息