摘要
近年来基础模型的进步催生了能够达到国际数学奥林匹克竞赛金牌水平的推理系统。然而,从竞赛级问题解决转向专业研究需要处理大量文献并构建长期证明。本文介绍了Aletheia,一个能够端到端生成、验证和修订解决方案的数学研究代理。Aletheia基于改进版Gemini Deep Think模型、超越奥数级别的推理时间扩展定律以及密集工具使用来应对数学研究的复杂性。我们展示了Aletheia从奥数问题到博士级别练习的能力,并通过多个里程碑展示了AI辅助数学研究的进展,包括AI自动生成的研究论文、人机协作证明粒子系统边界以及对700个开放问题的半自主评估。为帮助公众更好地理解AI与数学的发展,我们建议制定量化AI辅助成果自主性和新颖性的标准。最后,我们反思了人类与AI在数学领域的合作。
AI 推荐理由
论文涉及AI代理在数学研究中的应用,但未明确讨论记忆机制或架构。
论文信息