摘要
基于LLM的智能体系统的配置涉及从大量组合设计空间中选择工作流、工具、令牌预算和提示,目前通常通过固定的大模板或手工调整的启发式方法处理。这导致了行为脆弱性和不必要的计算开销,因为相同的繁琐配置经常应用于简单和复杂输入查询。本文将智能体配置表述为逐个查询的决策问题,并引入ARC(Agentic Resource & Configuration learner),该方法利用强化学习学习一个轻量级的分层策略,以动态定制这些配置。在多个涵盖推理和工具增强问答的基准测试中,所学策略始终优于强大的手工设计和其他基线,在提高任务准确性的同时也降低了令牌和运行时成本。这些结果表明,学习每个查询的智能体配置是“一刀切”设计的强大替代方案。
AI 推荐理由
论文涉及Agent配置与资源分配,间接关联到Memory管理,但非核心主题。
论文信息