混合模型 动态优化 智能体协作 RNN结构 模型选择
摘要

本文提出了一种名为N向自评估推理(NSED)的协议,这是一种运行时混合模型(MoM)架构,能够从多个不同的专家智能体中构建出涌现的复合模型。不同于传统的专家混合(MoE)依赖静态门控网络,NSED采用了一个动态专业代理器——一种运行时优化引擎,将模型选择视为背包问题的变体,并根据实时遥测数据和成本约束将异构检查点绑定到功能角色。在执行层面上,我们形式化推理为一个宏观尺度的循环神经网络(RNN),其中共识状态通过语义遗忘门回传,从而实现迭代优化而无需按比例扩展VRAM。关键组件包括用于无信任N对N同行评审的编排框架、用于非线性共识的二次投票激活函数以及反馈驱动的状态更新。在具有挑战性的基准测试(AIME 2025、LiveCodeBench)上的实验证明,这种拓扑结构允许小型消费级模型(小于20B参数)的集合匹配或超越最先进的100B+参数模型,确立了新的硬件套利效率前沿。此外,在DarkBench安全套件上的测试还揭示了内在对齐特性,同行调解校正使奉承分数低于任何单个智能体。

AI 推荐理由

论文涉及多模型协作与动态决策机制,与Agent Memory有一定关联但非核心主题。

论文信息
作者 Tims Pecerskis, Aivars Smirnovs
发布日期 2026-01-23
arXiv ID 2601.16863
相关性评分 6/10 (相关)