摘要
针对物理 plausible 的 3D 运动合成依赖人工干预的问题,本文提出 PhysAgent,首个闭环多智能体框架。该方法解耦材料与动力学,利用配备外力场技能模块的语义智能体掌握仿真规则;随后,细化智能体基于轨迹反馈,将视觉模型提取的运动轨迹转化为文本描述,借助大模型常识推理实现零-shot 宏观跳跃,动态切换离散力场并逃离局部最优。实验表明,该方法在生成多样性和物理准确性上显著优于现有基线。
AI 推荐理由
论文核心在于构建具备特定力场技能模块的智能体,通过工具调用解决物理仿真难题。
研究机构
北京理工大学
论文信息