摘要
近年来,大型语言模型向智能体系统的扩展引起了广泛关注。尽管智能体的有效性持续提升,但对实际部署至关重要的效率问题却常被忽视。本文从智能体的三个核心组件——记忆、工具学习和规划出发,探讨了包括延迟、令牌数、步骤数等成本因素在内的效率问题。我们回顾了多种近期方法,这些方法在实现上有所不同,但在高层原则上趋于一致,如通过压缩和管理限制上下文、设计强化学习奖励以减少工具调用、采用受控搜索机制提高效率等。我们从两个互补的角度定义了效率:在固定成本预算下比较有效性,以及在相似有效性的前提下比较成本。这种权衡也可通过有效性与成本之间的帕累托前沿来理解。此外,我们还总结了评估这些组件的协议,并整合了基准测试和方法论研究中常见的效率指标。最后,我们讨论了关键挑战和未来方向,旨在提供有前景的见解。
AI 推荐理由
论文明确将Memory作为智能体效率研究的核心组成部分,深入探讨了其优化方法。
论文信息