摘要
为了完成由人类以自然语言提供的任务,机器人必须解释指令、生成和回答与场景理解相关的问题,并操作目标对象。在实际部署中,通常需要多个具有不同操作能力的异构机器人协同处理不同的任务。除了需要专门的操作技能外,有效的信息收集对于完成这些任务也至关重要。为了解决这一问题,我们将信息收集过程形式化为一个未被充分研究的多智能体多任务具身问答(MM-EQA)问题,这是经典具身问答(EQA)的一个新扩展,其中有效的通信对于协调工作并避免冗余至关重要。为此,我们提出了一种基于LLM的去中心化通信框架CommCP,用于MM-EQA。该框架采用符合预测技术对生成的消息进行校准,从而减少接收者的干扰并提高通信可靠性。为了评估我们的框架,我们引入了一个包含多样化、逼真的家庭场景和具身问题的MM-EQA基准测试。实验结果表明,CommCP在任务成功率和探索效率方面显著优于基线方法。
AI 推荐理由
论文涉及基于LLM的多智能体通信机制,与Agent Memory相关但非核心主题。
论文信息