摘要
在多智能体系统领域,部分可观测性是有效协调与决策的关键障碍。现有方法如信念状态估计和智能体间通信往往效果不佳。基于信念的方法受限于对过去经验的依赖,而通信方法缺乏有效利用辅助信息的模型。为了解决这一问题,本文提出全局状态扩散算法(GlobeDiff),通过局部观测推断全局状态。将状态推断过程建模为多模态扩散过程,GlobeDiff克服了状态估计中的模糊性,并能高保真地推断全局状态。我们证明了GlobeDiff在单模态和多模态分布下的估计误差均可被限制。大量实验结果表明,GlobeDiff性能优越,能够准确推断全局状态。
AI 推荐理由
论文提出GlobeDiff算法解决多智能体系统的部分可观测性问题,涉及全局状态推断,与Agent Memory相关。
论文信息