摘要
本文介绍了InternAgent-1.5,这是一个专为端到端科学发现设计的统一系统,适用于计算和实证领域。该系统基于由生成、验证和演化三个协调子系统组成的结构化架构,并依赖于深度研究、解决方案优化和长时程记忆等基础能力。该架构使InternAgent-1.5能够在长时间的发现周期中持续运行并保持行为的一致性和改进性。同时,它还支持在单一系统内协调计算建模与实验室实验。我们在GAIA、HLE、GPQA和FrontierScience等科学推理基准上对InternAgent-1.5进行了评估,系统表现优异,展示了其强大的基础能力。此外,我们还评估了两类发现任务:在算法发现任务中,InternAgent-1.5自主设计了针对核心机器学习问题的竞争性方法;在实证发现任务中,它执行完整的计算或湿实验,并在地球、生命、生物和物理领域产生科学发现。总体而言,这些结果表明InternAgent-1.5提供了一个通用且可扩展的框架,用于实现自主科学发现。
AI 推荐理由
论文提到了长时程记忆机制,是系统的关键组成部分,但并非唯一研究重点。
论文信息