Agent Memory 嵌入模型 负样本采样 记忆检索
摘要

增强记忆的语言代理依赖于嵌入模型实现有效的记忆检索。然而,现有训练数据构建忽视了一个关键限制:负样本的层次化难度及其在人机交互中的自然分布。实际上,一些负样本是语义上相近的干扰项,而另一些则是明显无关的,自然对话中这两类样本的比例具有结构性特征。当前使用合成或均匀采样的负样本方法无法反映这种多样性,限制了嵌入模型学习精细判别能力,从而影响记忆检索的鲁棒性。本文提出了一种基于原理的数据构建框架HiNS,显式建模负样本的难度层级,并结合从对话数据中得出的经验性负样本比例,使嵌入模型在记忆密集型任务中显著提升了检索精度和泛化能力。实验结果表明,在LoCoMo和PERSONAMEM数据集上均取得了显著提升。

AI 推荐理由

论文直接针对Agent Memory中的嵌入模型优化,提出改进的负样本采样方法以提升记忆检索效果。

论文信息
作者 Motong Tian, Allen P. Wong, Mingjun Mao, Wangchunshu Zhou
发布日期 2026-01-21
arXiv ID 2601.14857
相关性评分 9/10 (高度相关)