LLM Agent 模型选择 医疗系统 神经过程 工具选择
摘要

任务专用模型是智能医疗系统的核心组成部分,使代理能够回答包括疾病诊断、定位和报告生成在内的临床问题。然而,对于给定任务,通常不存在单一的最佳模型。实际上,每个任务更适合由多个竞争的专家模型来处理,不同模型在不同的数据样本上表现优异。因此,对于任何给定的查询,代理必须可靠地从异构的工具候选池中选择合适的专家模型。为此,我们引入了ToolSelect,通过最小化采样专家工具候选的群体风险,使用一致的条件选择损失替代函数,自适应地学习工具选择。具体而言,我们提出了一种基于注意力神经过程的选择器,该选择器根据查询和每种模型的行为摘要,在专家模型之间进行选择。由于缺乏已有的测试平台,我们首次引入了一个智能胸部X光环境,并配备了多种任务专用模型(17种疾病检测、19种报告生成、6种视觉定位和13种视觉问答),并开发了包含1448个查询的ToolSelectBench基准。实验结果表明,ToolSelect在四种不同的任务类别中始终优于10种最先进的方法。

AI 推荐理由

论文涉及模型选择机制,与Agent Memory相关,但非核心研究内容。

论文信息
作者 Pramit Saha, Joshua Strong, Mohammad Alsharid, Divyanshu Mishra, J. Alison Noble
发布日期 2026-02-16
arXiv ID 2602.14901
相关性评分 6/10 (相关)