摘要
在博弈论中,不完全记忆决策问题建模了代理遗忘先前信息的情况,包括如“健忘司机”和有限通信团队游戏等场景。本文首次引入了一个用于不完全记忆决策问题的基准测试套件,涵盖隐私保护、AI安全等多个问题类型。通过61个实例评估不同算法在寻找最优策略中的表现,特别提出了一类无参数的遗憾匹配(RM)算法,并发现其在大规模约束优化问题中显著优于传统方法。
AI 推荐理由
论文涉及不完全记忆决策问题,与Agent Memory相关,但非核心主题。
论文信息