摘要
针对大语言模型长上下文输入中常见的“中间迷失”问题,本文提出自适应任务感知压缩器(ATACompressor)。该方法通过选择性编码器仅压缩与任务相关的上下文部分,在保留关键信息的同时减少冗余内容。其自适应分配控制器能感知相关内容长度并动态调整压缩率,从而优化资源利用。在 HotpotQA、MSMARCO 和 SQUAD 数据集上的评估表明,该方法在压缩效率和任务性能上均优于现有技术,为长上下文处理提供了可扩展的解决方案。
AI 推荐理由
论文提出自适应压缩机制以优化长上下文处理,直接解决记忆稀释问题,属于核心记忆架构研究。
研究机构
清华大学计算机系,北京,中国
论文信息