3D Scene Graph Physical Reasoning Robot Perception Visual Reasoning
摘要

机器人执行日常任务需构建兼具语义丰富性、物理基础及结构化的 3D 表示以支持规划。现有方法多忽视物理因素或泛化性不足。本文提出 PhysGraph 框架,统一符号推理与结构化 3D 几何,对杂乱场景中的运动学和物理属性建模。该框架基于 RGB-D 观测重建物体几何,分解功能部件,并通过视觉推理推断材质与关节结构。实验表明,其在语义分割、质量估计及关节预测上达到最先进水平,为下游约束感知 affordance 预测等任务提供了物理一致的结构化表示。

AI 推荐理由

论文核心是通过视觉推理推断物理属性,虽服务于规划,但重点在于推理机制本身。

研究机构
中国科学院自动化研究所
论文信息
作者 Haoyu Li, Aaron Thomas, Shuyan Zhou, Xianyi Cheng
发布日期 2026-06-07
arXiv ID 2606.08655
相关性评分 8/10 (高度相关)