代理检索与强化学习方程链：一种面向复杂新颖物理应用题的可控生成框架

Physics Word Problems Reinforcement Learning RAG Controlled Generation

摘要

生成高质量、新颖且可解的物理应用题仍是教育内容生成领域的难题。现有方法常产生模糊或结构简单的题目。本文提出 ARVRE 框架，分两阶段解决该问题：首先利用离线时序差分学习构建有效物理方程链，并结合代理检索增强生成动态选择概念；随后利用大语言模型将方程链转化为自然语言问题。该方法通过基于有效方程链的生成，在保持数学正确性的同时提升了语言多样性。评估结果表明，ARVRE 生成的题目在复杂性、新颖性和可解性上均优于现有方法。

AI 推荐理由

论文核心在于构建有效的物理方程链以确保逻辑正确性，属于推理能力的结构化应用。

研究机构

未提供具体单位信息

论文信息

作者 Tirthankar Mittra

发布日期 2026-06-14

arXiv ID 2606.15591