摘要
本文提出 BELLA 框架,旨在解决大语言模型(LLM)实践中任务与模型匹配及成本控制难题。针对现有基准测试掩盖具体能力需求的问题,BELLA 通过三阶段流程实现基于技能的优化选择:利用批评者机制分解输出并提取细粒度技能、将技能聚类为结构化能力矩阵、以及进行多目标优化以在预算约束下最大化性能。该框架提供自然语言解释,增强了路由透明度,并在金融推理领域验证了其在平衡成本与性能方面的有效性。
AI 推荐理由
论文核心在于通过细粒度技能剖析(skill-profiling)来优化模型选择,直接聚焦于技能评估与应用。
研究机构
佐治亚理工学院
论文信息