摘要
针对现有代理系统依赖大模型导致的高成本与隐私问题,本文提出 effGen,一个专为小型语言模型(SLM)优化的开源代理框架。其核心贡献包括:通过提示优化压缩上下文以增强工具调用;基于依赖关系将复杂查询分解为并行或串行子任务的智能任务分解机制;利用五因素进行预执行决策的复杂度路由策略;以及结合短长期与向量存储的统一记忆系统。实验表明,effGen 在多个基准测试中优于主流框架,且提示优化与复杂度路由在不同模型规模下表现出互补的扩展行为。
AI 推荐理由
论文核心贡献包含智能任务分解与基于复杂度的路由决策,属于典型的规划能力研究。
研究机构
弗吉尼亚理工大学计算机科学系,美国
谷歌DeepMind,美国
佐治亚理工学院计算机科学系,美国
论文信息