摘要
机器人预计将在未来建筑行业中发挥重要作用,但面临高成本和难以适应动态任务的挑战。本研究探讨了基础模型在增强建筑机器人任务规划适应性和泛化能力方面的潜力。采用轻量级开源大语言模型(LLMs)和视觉语言模型(VLMs)提出了四种模型,包括一个单智能体和三个协作的多智能体团队,用于生成机器人操作计划。在三种建筑角色(油漆工、安全检查员和地板铺装)中对模型进行了评估。结果显示,四智能体团队在大多数指标上优于最先进的GPT-4o,并且成本效益提高了十倍。此外,三智能体和四智能体团队展示了更好的泛化能力。通过讨论智能体行为如何影响输出,本研究加深了对AI团队的理解,并支持未来在多样化非结构化环境中的研究。
AI 推荐理由
论文涉及多智能体协作与任务规划,间接关联记忆机制,但未明确研究记忆系统。
论文信息