从 USD 场景到知识图谱：基于大语言模型的零样本本体接地

Knowledge Graph Robotics Zero-Shot Learning Semantic Grounding

摘要

从 3D 仿真场景构建知识图谱对机器人任务推理至关重要，但将场景对象接地至形式化本体类这一瓶颈仍依赖脆弱且泛化性差的手动词典。本文研究大语言模型（LLM）能否作为零样本、免训练的替代方案，自动化通用场景描述（USD）的本体接地过程。在厨房场景实验中，LLM 在使用描述性名称时精确匹配准确率达 90-96%，显著优于词典和嵌入基线。特征消融表明，LLM 主要利用场景图中的语义线索（如兄弟节点名称和父路径），若匿名化这些线索，准确率将降至 0-6%。

AI 推荐理由

论文聚焦利用 LLM 语义推理能力解决机器人任务中的本体接地问题，是任务推理的关键前置步骤。

研究机构

University of Berlin, Germany

论文信息

作者 Jiangtao Shuai, Zongxiong Chen, Manfred Hauswirth, Sonja Schimmler

发布日期 2026-06-08

arXiv ID 2606.09134