Multimodal LLM Program Repair Visual Reasoning Scene Graph
摘要

针对现有自动程序修复方法忽视截图等视觉诊断信号的问题,本文提出 SVRepair 框架。该方法首先微调视觉语言模型,将异构视觉工件转化为捕捉 GUI 元素及其结构关系的语义场景图,提供标准化上下文。在此基础上,驱动编码代理进行故障定位与补丁合成,并引入迭代式视觉分割策略,逐步聚焦 bug 中心区域以抑制无关上下文和幻觉。实验表明,SVRepair 在多个基准测试中取得了最先进的性能,验证了结构化视觉推理在多模态程序修复中的有效性。

AI 推荐理由

论文核心提出结构化视觉推理框架,通过场景图增强多模态逻辑推理以解决程序修复问题。

研究机构
Ant Group 浙江大学无障碍感知与智能系统浙江省重点实验室
论文信息
作者 Xiaoxuan Tang, Jincheng Wang, Liwei Luo, Jingxuan Xu, Sheng Zhou et al.
发布日期 2026-02-05
arXiv ID 2602.06090
相关性评分 9/10 (高度相关)