面向决策支持的任务感知大语言模型委员会与自适应决策路径

Multi-LLM Collaboration Monte Carlo Tree Search Adaptive Planning Decision Support

摘要

针对现有方法忽视大语言模型（LLM） specialization 差异的问题，本文提出任务感知 LLM 委员会（TALC）。该框架结合蒙特卡洛树搜索（MCTS），通过结构化成功记忆档案实现语义匹配，动态路由至最适模型。系统利用融合模型评估与历史效用的双信号机制指导节点价值估计，自适应平衡探索深度与规划置信度。实验表明，TALC 在多项基准测试中显著提升了任务成功率与搜索效率。

AI 推荐理由

论文核心提出基于 MCTS 的动态专家选择与多步规划框架，直接解决任务规划问题。

研究机构

云南大学信息科学与工程学院，昆明，中国卡内基梅隆大学语言技术研究所，宾夕法尼亚州匹兹堡，美国

论文信息

作者 Wei Zhu, Lixing Yu, Hao-Ren Yao, Zhiwen Tang, Kun Yue

发布日期 2026-01-30

arXiv ID 2601.22662