摘要
本文提出了实验自动化代理(EAA),一种基于视觉语言模型的智能代理系统,旨在自动化复杂的显微实验流程。EAA集成了多模态推理、工具增强动作以及可选的长期记忆功能,以支持自主操作和用户引导的交互式测量。该系统基于灵活的任务管理架构,能够实现从完全由代理驱动的自动化到嵌入局部LLM查询的逻辑定义流程。此外,EAA提供了一个现代工具生态系统,具备与模型上下文协议(MCP)双向兼容的能力,使仪器控制工具可以在不同应用中被调用或服务。我们在先进光子源的成像光束线上展示了EAA的应用,包括自动区域板聚焦、自然语言描述的特征搜索以及交互式数据采集。这些结果表明,具备视觉能力的代理可以提高光束线效率,减轻操作负担,并降低用户的专业知识门槛。
AI 推荐理由
论文提及了可选的长期记忆模块,但并非研究核心,属于相关但非关键主题。
论文信息