摘要
针对现有自动程序修复方法忽视截图等视觉诊断信号的问题,本文提出 SVRepair 框架。该方法首先微调视觉语言模型,将异构视觉工件转化为捕捉 GUI 元素及其结构关系的语义场景图,提供标准化上下文。在此基础上,驱动编码代理进行故障定位与补丁合成,并引入迭代式视觉分割策略,逐步聚焦 bug 中心区域以抑制无关上下文和幻觉。实验表明,SVRepair 在多个基准测试中取得了最先进的性能,验证了结构化视觉推理在多模态程序修复中的有效性。
AI 推荐理由
论文核心提出结构化视觉推理框架,通过场景图增强多模态逻辑推理以解决程序修复问题。
研究机构
Ant Group
浙江大学无障碍感知与智能系统浙江省重点实验室
论文信息