Agent Memory 视频生成 局部记忆 3D重建 跨视角对齐
摘要

在长时域可控相机视频生成中,保持空间世界一致性仍是一个核心挑战。现有基于记忆的方法通常依赖于从历史重建的全局3D场景进行锚定视频渲染,但多视角重建不可避免地引入跨视角对齐误差,导致几何噪声并影响生成质量。本文提出AnchorWeave,一种增强记忆的视频生成框架,用多个干净的局部几何记忆替代单一不一致的全局记忆,并学习协调其跨视角不一致性。该方法通过覆盖驱动的局部记忆检索与目标轨迹对齐,并通过多锚点编织控制器整合所选局部记忆。大量实验表明,AnchorWeave显著提升了长期场景一致性,同时保持了高质量的视觉效果,消融分析进一步验证了局部几何条件、多锚点控制和覆盖驱动检索的有效性。

AI 推荐理由

论文核心围绕基于记忆的视频生成框架,提出局部几何记忆机制以解决全局一致性问题。

论文信息
作者 Zun Wang, Han Lin, Jaehong Yoon, Jaemin Cho, Yue Zhang et al.
发布日期 2026-02-16
arXiv ID 2602.14941
相关性评分 9/10 (高度相关)