LLM 不确定性处理 具身智能体 规划系统 多智能体
摘要

在多智能体、部分可观测和去中心化的环境中,具身智能体必须在对隐藏对象和合作者意图存在广泛不确定性的情况下进行规划和行动。尽管近期将大语言模型(LLMs)应用于具身智能体已解决了许多长期存在的挑战,如高层目标分解和在线适应,但不确定性仍主要通过频繁的智能体间通信来缓解。这会带来显著的token和时间成本,并可能干扰已有工作流程,尤其是在涉及人类合作伙伴时。本文提出PCE框架,该框架将LLM推理轨迹中隐含的碎片化假设转化为结构化的决策树。内部节点编码环境假设,叶子节点映射到动作;每条路径根据场景可能性、目标导向收益和执行成本进行评分,以指导理性行动选择,而无需大量通信。在两个具有挑战性的多智能体基准(C-WAH和TDW-MAT)和三种不同的LLM主干上,PCE在成功率和任务效率方面均优于以通信为中心的基线方法,同时显示出相当的token使用量。消融实验表明,当应用PCE时,通过扩展模型容量或推理深度获得的性能提升仍然存在,而PCE在容量和推理深度尺度上始终提高基线,证实了结构化不确定性处理可以补充这两种扩展方式。用户研究进一步表明,PCE生成的通信模式被人类合作伙伴视为更高效和可信。这些结果共同确立了一种原理性方法,将LLM潜在的假设转化为不确定性感知规划的可靠策略。

AI 推荐理由

论文涉及LLM推理中的不确定性处理,与Agent Memory相关但非核心主题。

论文信息
作者 SeungWon Seo, SooBin Lim, SeongRae Noh, Haneul Kim, HyeongYeop Kang
发布日期 2026-02-04
arXiv ID 2602.04326
相关性评分 7/10 (相关)