动态环境中具身智能体的测试时世界模型混合

World Models Mixture of Experts Embodied Agents Dynamic Environments Test-time Adaptation

摘要

基于语言模型的具身智能体在动态环境中适应性受限，构建准确灵活的世界模型对有效推理至关重要。本文提出测试时世界模型混合（TMoW）框架，突破传统混合专家架构路由固定的局限。该方法通过多粒度原型路由、测试时特征对齐及蒸馏混合增强机制，使智能体能在推理阶段动态更新路由函数，重组现有模型并整合新模型。实验表明，TMoW 在零样本适应和少样本扩展场景中均表现优异，显著提升了具身智能体在动态环境中的操作能力。

AI 推荐理由

论文核心提出动态世界模型混合架构，旨在提升智能体在动态环境中的推理与决策适应性。

研究机构

韩国成均馆大学计算机科学与工程系

论文信息

作者 Jinwoo Jang, Minjong Yoo, Sihyung Yoon, Honguk Woo

发布日期 2026-01-30

arXiv ID 2601.22647