SAME：用于多模态持续指令调优的稳定化混合专家模型

Continual Learning Mixture-of-Experts Multimodal LLM Catastrophic Forgetting

摘要

多模态大语言模型需通过持续指令调优扩展能力，但现有稀疏专家路由方法面临数据分布演化导致的漂移问题。具体表现为路由漂移（专家选择不一致）和专家漂移（共享专家被覆盖）。为此，本文提出稳定化混合专家模型（SAME）。该方法通过将路由动态分解为正交子空间来稳定专家选择，并利用曲率感知缩放调节专家更新以缓解遗忘，无需重放历史数据。此外，引入自适应专家激活机制冻结选定专家，减少冗余计算与任务间干扰，实验证明其达到了最先进水平。

AI 推荐理由

论文核心解决多模态持续学习中的灾难性遗忘与专家漂移问题，属于 Agent 自我进化与自适应范畴。

研究机构

中国

论文信息

作者 Zhen-Hao Xie, Jun-Tao Tang, Yu-Cheng Shi, Han-Jia Ye, De-Chuan Zhan et al.

发布日期 2026-02-02

arXiv ID 2602.01990