摘要
代理记忆系统已成为使大型语言模型(LLM)代理维持长期上下文并高效检索相关信息的关键技术。然而,现有记忆框架存在一个根本性限制:无论查询特征如何,它们都会对整个存储层进行穷举检索。这种暴力方法在记忆增长时会造成严重的延迟瓶颈,阻碍实时代理交互。我们提出了SwiftMem,一种基于查询感知的代理记忆系统,通过在时间和语义维度上的专用索引实现亚线性检索。我们的时序索引支持时间敏感检索的对数时间范围查询,而语义DAG-Tag索引则通过分层标签结构将查询映射到相关主题。为了解决增长过程中的记忆碎片化问题,我们引入了嵌入-标签协同巩固机制,根据语义聚类重新组织存储以提高缓存局部性。在LoCoMo和LongMemEval基准测试中的实验表明,SwiftMem相比最先进的基线实现了47倍的搜索速度提升,同时保持了竞争力的准确性,使得增强记忆的LLM代理得以实际部署。
AI 推荐理由
论文直接针对Agent Memory系统提出改进方法,核心研究内容为记忆检索机制与索引优化。
论文信息