Agent Memory Memory Compression Semantic Search Efficient Retrieval LLM Agent
摘要

智能体AI需要持久记忆来存储超出LLM上下文窗口的用户特定历史。现有记忆系统使用密集向量数据库或知识图谱遍历(或混合),导致检索延迟高且存储扩展性差。本文提出Hippocampus,一种基于紧凑二进制签名进行语义搜索、利用无损token-ID流进行精确内容重建的智能体记忆管理系统。其核心是动态小波矩阵(DWM),用于压缩并联合索引两种流,从而在压缩域内实现超快速搜索,避免了代价高昂的密集向量或图计算。该设计随内存规模线性扩展,适用于长期智能体部署。实验表明,Hippocampus将端到端检索延迟降低至原来的1/31,并减少每个查询的token占用量达14倍,同时在LoCoMo和LongMemEval基准测试中保持准确性。

AI 推荐理由

论文标题和内容均明确聚焦于Agent Memory系统的设计与优化,是核心研究。

论文信息
作者 Yi Li, Lianjie Cao, Faraz Ahmed, Puneet Sharma, Bingzhe Li
发布日期 2026-02-14
arXiv ID 2602.13594
相关性评分 10/10 (高度相关)