摘要
针对多模态大模型在几何推理中因高质量图文对稀缺而表现不佳的问题,本文提出 Socratic-Geo 框架。该框架通过多智能体交互动态耦合数据合成与模型学习:教师智能体生成带反思反馈的参数化 Python 脚本以确保数据纯度;求解智能体利用偏好学习优化推理,失败路径指导针对性增强;生成智能体则从积累的数据中蒸馏绘图能力。实验表明,该方法在少量种子数据下显著提升了基准测试成绩,并在图像生成任务上达到开源模型最先进水平。
AI 推荐理由
论文核心解决几何推理瓶颈,通过多智能体交互提升推理能力与数据质量。
研究机构
阿里巴巴集团控股有限公司
EPIC实验室,上海交通大学
上海财经大学
武汉大学
论文信息