LLM Agent 配置优化 强化学习 资源管理
摘要

基于LLM的智能体系统的配置涉及从大量组合设计空间中选择工作流、工具、令牌预算和提示,目前通常通过固定的大模板或手工调整的启发式方法处理。这导致了行为脆弱性和不必要的计算开销,因为相同的繁琐配置经常应用于简单和复杂输入查询。本文将智能体配置表述为逐个查询的决策问题,并引入ARC(Agentic Resource & Configuration learner),该方法利用强化学习学习一个轻量级的分层策略,以动态定制这些配置。在多个涵盖推理和工具增强问答的基准测试中,所学策略始终优于强大的手工设计和其他基线,在提高任务准确性的同时也降低了令牌和运行时成本。这些结果表明,学习每个查询的智能体配置是“一刀切”设计的强大替代方案。

AI 推荐理由

论文涉及Agent配置与资源分配,间接关联到Memory管理,但非核心主题。

论文信息
作者 Aditya Taparia, Som Sagar, Ransalu Senanayake
发布日期 2026-02-12
arXiv ID 2602.11574
相关性评分 6/10 (相关)