World Models Mixture of Experts Embodied Agents Dynamic Environments Test-time Adaptation
摘要

基于语言模型的具身智能体在动态环境中适应性受限,构建准确灵活的世界模型对有效推理至关重要。本文提出测试时世界模型混合(TMoW)框架,突破传统混合专家架构路由固定的局限。该方法通过多粒度原型路由、测试时特征对齐及蒸馏混合增强机制,使智能体能在推理阶段动态更新路由函数,重组现有模型并整合新模型。实验表明,TMoW 在零样本适应和少样本扩展场景中均表现优异,显著提升了具身智能体在动态环境中的操作能力。

AI 推荐理由

论文核心提出动态世界模型混合架构,旨在提升智能体在动态环境中的推理与决策适应性。

研究机构
韩国成均馆大学计算机科学与工程系
论文信息
作者 Jinwoo Jang, Minjong Yoo, Sihyung Yoon, Honguk Woo
发布日期 2026-01-30
arXiv ID 2601.22647
相关性评分 9/10 (高度相关)