Multi-LLM Collaboration Monte Carlo Tree Search Adaptive Planning Decision Support
摘要

针对现有方法忽视大语言模型(LLM) specialization 差异的问题,本文提出任务感知 LLM 委员会(TALC)。该框架结合蒙特卡洛树搜索(MCTS),通过结构化成功记忆档案实现语义匹配,动态路由至最适模型。系统利用融合模型评估与历史效用的双信号机制指导节点价值估计,自适应平衡探索深度与规划置信度。实验表明,TALC 在多项基准测试中显著提升了任务成功率与搜索效率。

AI 推荐理由

论文核心提出基于 MCTS 的动态专家选择与多步规划框架,直接解决任务规划问题。

研究机构
云南大学信息科学与工程学院,昆明,中国 卡内基梅隆大学语言技术研究所,宾夕法尼亚州匹兹堡,美国
论文信息
作者 Wei Zhu, Lixing Yu, Hao-Ren Yao, Zhiwen Tang, Kun Yue
发布日期 2026-01-30
arXiv ID 2601.22662
相关性评分 9/10 (高度相关)