Physics Word Problems Reinforcement Learning RAG Controlled Generation
摘要

生成高质量、新颖且可解的物理应用题仍是教育内容生成领域的难题。现有方法常产生模糊或结构简单的题目。本文提出 ARVRE 框架,分两阶段解决该问题:首先利用离线时序差分学习构建有效物理方程链,并结合代理检索增强生成动态选择概念;随后利用大语言模型将方程链转化为自然语言问题。该方法通过基于有效方程链的生成,在保持数学正确性的同时提升了语言多样性。评估结果表明,ARVRE 生成的题目在复杂性、新颖性和可解性上均优于现有方法。

AI 推荐理由

论文核心在于构建有效的物理方程链以确保逻辑正确性,属于推理能力的结构化应用。

研究机构
未提供具体单位信息
论文信息
作者 Tirthankar Mittra
发布日期 2026-06-14
arXiv ID 2606.15591
相关性评分 8/10 (高度相关)