摘要
本文提出了一种名为N向自评估推理(NSED)的协议,这是一种运行时混合模型(MoM)架构,能够从多个不同的专家智能体中构建出涌现的复合模型。不同于传统的专家混合(MoE)依赖静态门控网络,NSED采用了一个动态专业代理器——一种运行时优化引擎,将模型选择视为背包问题的变体,并根据实时遥测数据和成本约束将异构检查点绑定到功能角色。在执行层面上,我们形式化推理为一个宏观尺度的循环神经网络(RNN),其中共识状态通过语义遗忘门回传,从而实现迭代优化而无需按比例扩展VRAM。关键组件包括用于无信任N对N同行评审的编排框架、用于非线性共识的二次投票激活函数以及反馈驱动的状态更新。在具有挑战性的基准测试(AIME 2025、LiveCodeBench)上的实验证明,这种拓扑结构允许小型消费级模型(小于20B参数)的集合匹配或超越最先进的100B+参数模型,确立了新的硬件套利效率前沿。此外,在DarkBench安全套件上的测试还揭示了内在对齐特性,同行调解校正使奉承分数低于任何单个智能体。
AI 推荐理由
论文涉及多模型协作与动态决策机制,与Agent Memory有一定关联但非核心主题。
论文信息