摘要
近年来,基于大语言模型的多智能体系统发展迅速,通常利用路由器分解任务并委托给专用智能体。然而,盲目扩充智能体池会导致路由器在面对新加入的异构智能体时性能崩溃。本文提出 MonoScale,一种感知扩展的更新框架,通过生成熟悉化任务、收集成败交互证据,并将其蒸馏为可审计的自然语言记忆以指导未来路由。该方法将序列增强形式化为上下文多臂老虎机问题,执行信任域记忆更新,从而保证性能在扩展过程中单调非递减。实验表明其在智能体池增长时表现稳定且优于基线。
AI 推荐理由
论文提出将交互证据蒸馏为可审计的自然语言记忆,以此作为路由核心机制,确保系统单调改进。
研究机构
清华大学
论文信息