Multi-LLM Collaboration MCTS Compiler Optimization Collaborative Reasoning
摘要

针对模型服务成本高企的问题,本文提出 COLT 框架,旨在通过小型大语言模型(LLM)的协同推理达到或超越单一大型模型的性能。该方法在单次蒙特卡洛树搜索(MCTS)中协调多个模型,利用共享 MCTS 树作为协作基础,实现转换前缀复用和跨模型价值传播。通过内生化的模型选择机制、感知模型的树策略及课程调整机制,该框架避免了复杂的外部规划器与记忆系统,高效完成了编译器优化任务中的协同推理过程。

AI 推荐理由

论文核心提出基于共享 MCTS 的多模型协同推理框架,直接研究推理机制与策略。

研究机构
加利福尼亚大学圣地亚哥分校
论文信息
作者 Annabelle Sujun Tang, Christopher Priebe, Lianhui Qin, Hadi Esmaeilzadeh
发布日期 2026-02-02
arXiv ID 2602.01935
相关性评分 9/10 (高度相关)