ATACompressor：面向大语言模型高效长上下文处理的自适应任务感知压缩

long-context context-compression adaptive-system

摘要

针对大语言模型长上下文输入中常见的“中间迷失”问题，本文提出自适应任务感知压缩器（ATACompressor）。该方法通过选择性编码器仅压缩与任务相关的上下文部分，在保留关键信息的同时减少冗余内容。其自适应分配控制器能感知相关内容长度并动态调整压缩率，从而优化资源利用。在 HotpotQA、MSMARCO 和 SQUAD 数据集上的评估表明，该方法在压缩效率和任务性能上均优于现有技术，为长上下文处理提供了可扩展的解决方案。

AI 推荐理由

论文提出自适应压缩机制以优化长上下文处理，直接解决记忆稀释问题，属于核心记忆架构研究。

研究机构

清华大学计算机系，北京，中国

论文信息

作者 Xuancheng Li, Haitao Li, Yujia Zhou, Qingyao Ai, Yiqun Liu

发布日期 2026-02-03

arXiv ID 2602.03226