学习配置基于LLM的智能体系统

LLM Agent 配置优化强化学习资源管理

摘要

基于LLM的智能体系统的配置涉及从大量组合设计空间中选择工作流、工具、令牌预算和提示，目前通常通过固定的大模板或手工调整的启发式方法处理。这导致了行为脆弱性和不必要的计算开销，因为相同的繁琐配置经常应用于简单和复杂输入查询。本文将智能体配置表述为逐个查询的决策问题，并引入ARC（Agentic Resource & Configuration learner），该方法利用强化学习学习一个轻量级的分层策略，以动态定制这些配置。在多个涵盖推理和工具增强问答的基准测试中，所学策略始终优于强大的手工设计和其他基线，在提高任务准确性的同时也降低了令牌和运行时成本。这些结果表明，学习每个查询的智能体配置是“一刀切”设计的强大替代方案。

AI 推荐理由

论文涉及Agent配置与资源分配，间接关联到Memory管理，但非核心主题。

论文信息

作者 Aditya Taparia, Som Sagar, Ransalu Senanayake

发布日期 2026-02-12

arXiv ID 2602.11574