摘要
本文研究了不同类型和用途的记忆如何帮助智能体在不断变化的不确定环境中进行空间导航。在所研究的简单觅食任务中,智能体每天需要从其家园穿过障碍物找到食物。世界是非平稳的,障碍物和食物的位置可能每天变化,且智能体的感知信息(如位置)具有不确定性和局限性。任何模型构建(如地图)和使用(如规划)都必须应对这些挑战,并且如果学习有用,必须足够快速。我们考察了多种策略,从简单到复杂,涉及不同的记忆和学习方式。我们发现,一种能够整合多种策略的架构是处理不同性质子任务的关键,尤其是在探索和搜索未知食物位置时,以及在规划通往已记住的(可能)食物位置的路径时。利用非平稳概率学习技术不断更新其(情景记忆)并使用这些记忆构建地图和实时规划(不完美的地图,即嘈杂且受限于智能体经验)的智能体,在任务难度(如目标距离)增加时,相较于简单的(低记忆)智能体,效率显著提高,只要定位和变化带来的不确定性不是太大。
AI 推荐理由
论文核心研究记忆在动态环境中的应用,探讨记忆机制对导航和规划的影响。
论文信息