摘要
针对现有方法忽视大语言模型(LLM) specialization 差异的问题,本文提出任务感知 LLM 委员会(TALC)。该框架结合蒙特卡洛树搜索(MCTS),通过结构化成功记忆档案实现语义匹配,动态路由至最适模型。系统利用融合模型评估与历史效用的双信号机制指导节点价值估计,自适应平衡探索深度与规划置信度。实验表明,TALC 在多项基准测试中显著提升了任务成功率与搜索效率。
AI 推荐理由
论文核心提出基于 MCTS 的动态专家选择与多步规划框架,直接解决任务规划问题。
研究机构
云南大学信息科学与工程学院,昆明,中国
卡内基梅隆大学语言技术研究所,宾夕法尼亚州匹兹堡,美国
论文信息