混合模型：通过N向自评估推理统一异构智能体

混合模型动态优化智能体协作 RNN结构模型选择

摘要

本文提出了一种名为N向自评估推理（NSED）的协议，这是一种运行时混合模型（MoM）架构，能够从多个不同的专家智能体中构建出涌现的复合模型。不同于传统的专家混合（MoE）依赖静态门控网络，NSED采用了一个动态专业代理器——一种运行时优化引擎，将模型选择视为背包问题的变体，并根据实时遥测数据和成本约束将异构检查点绑定到功能角色。在执行层面上，我们形式化推理为一个宏观尺度的循环神经网络（RNN），其中共识状态通过语义遗忘门回传，从而实现迭代优化而无需按比例扩展VRAM。关键组件包括用于无信任N对N同行评审的编排框架、用于非线性共识的二次投票激活函数以及反馈驱动的状态更新。在具有挑战性的基准测试（AIME 2025、LiveCodeBench）上的实验证明，这种拓扑结构允许小型消费级模型（小于20B参数）的集合匹配或超越最先进的100B+参数模型，确立了新的硬件套利效率前沿。此外，在DarkBench安全套件上的测试还揭示了内在对齐特性，同行调解校正使奉承分数低于任何单个智能体。

AI 推荐理由

论文涉及多模型协作与动态决策机制，与Agent Memory有一定关联但非核心主题。

论文信息

作者 Tims Pecerskis, Aivars Smirnovs

发布日期 2026-01-23

arXiv ID 2601.16863