因果建模 谓词发明 符号推理 持续学习
摘要

在复杂环境中高效导航需要智能体理解其世界的底层逻辑,而标准世界建模方法常面临样本效率低、透明度不足和可扩展性差的问题。本文提出一种框架,通过将连续模型学习与修复集成到智能体的决策循环中,利用元解释学习和谓词发明技术,发现语义上有意义且可复用的抽象概念,从而构建出层次化的解耦高质量概念体系。实验表明,该方法在具有复杂关系动态的领域中表现优异,其样本效率远高于基于PPO神经网络的基准方法。

AI 推荐理由

论文涉及因果模型构建与符号推理,与Agent Memory相关但非核心主题。

论文信息
作者 Enrique Crespo-Fernandez, Oliver Ray, Telmo de Menezes e Silva Filho, Peter Flach
发布日期 2026-02-19
arXiv ID 2602.17217
相关性评分 7/10 (相关)