摘要
完整的世界模型需要复杂且详尽的知识。尽管预训练的大模型由于在大量互联网数据上进行预训练,被认为可能包含类似知识,但直接使用它们进行搜索效率低下且不准确。相反,部分模型专注于对状态和动作子集进行高质量预测,这些状态和动作通过可操作性实现用户意图。本文正式回答了是否可以将大模型视为部分世界模型的问题,并证明了实现任务无关、语言条件意图的代理必然拥有由可操作性引导的预测性部分世界模型。在多任务设置中,我们引入了分布稳健的可操作性,并展示了如何提取部分模型以显著提高搜索效率。在桌面机器人任务中的实证评估表明,我们的可操作性感知部分模型减少了搜索分支因子,并相比完整世界模型实现了更高的奖励。
AI 推荐理由
论文探讨了基于affordances的LLM作为部分世界模型,与Agent Memory中的预测和状态建模相关。
论文信息