摘要
大型语言模型(LLMs)拥有广泛的世界知识,但有效提取这些知识的方法仍较少被研究。国籍和区域预测任务需要理解语言特征以及文化和历史背景,这使得LLM的世界知识特别有价值。然而,传统LLM提示方法依赖直接推理,难以应用抽象的语言规则。本文提出LLM联想记忆代理(LAMA),一种利用LLM世界知识作为联想记忆的新框架。LAMA不直接从名字推断国籍,而是通过回忆同名的著名人物并聚合其国籍来实现间接推理。该框架采用包含人物代理和媒体代理的双代理架构,并行召回名人信息,通过投票生成Top-1预测,通过条件补全生成Top-K预测。在99个国家的国籍预测任务中,LAMA达到0.817的准确率,显著优于传统LLM提示方法和神经网络模型。实验表明,LLM在回忆具体实例方面比抽象推理更可靠,基于回忆的方法对低频国籍具有鲁棒性,且双代理架构能够互补协同产生协同效应。这些结果证明了通过检索和聚合LLM知识而非提示推理的新多代理系统的有效性。
AI 推荐理由
论文核心提出LLM Associative Memory Agents框架,明确以记忆机制为核心,用于国籍预测任务。
论文信息