摘要
本文提出 P3D-Bench,旨在评估多模态大模型(MLLMs)在参数化 3D 生成及结构推理方面的能力。现有基准鲜少关注通过代码进行的 3D 建模,而该任务要求模型从文本或视觉输入中生成几何精确、语义对齐且装配一致的参数化程序。P3D-Bench 涵盖文本转 3D、图像转 3D 及装配 3D 三类任务,从可执行性、几何保真度、拓扑结构等多维度评分。实验表明,模型在部件装配与精确参数还原上仍存在显著缺陷,尤其在复杂装配场景中表现薄弱。
AI 推荐理由
论文核心评估 MLLM 的结构推理与参数化几何生成能力,重点在于逻辑与空间推理。
研究机构
Nanjing University
Envision
论文信息