摘要
本文介绍了 Kimi K2.5,一种旨在推进通用代理智能的开源多模态代理模型。该模型强调文本与视觉的联合优化,采用联合预训练、零视觉监督微调及联合强化学习等技术。在此基础上,K2.5 提出了 Agent Swarm,这是一个自导向的并行代理编排框架,能将复杂任务动态分解为异构子问题并并发执行。评估显示,Kimi K2.5 在编码、视觉、推理及代理任务等多个领域达到最先进水平,且 Agent Swarm 将延迟降低了高达 4.5 倍。
AI 推荐理由
论文核心提出 Agent Swarm 框架,专注于动态任务分解与并发执行,是典型的规划能力研究。
研究机构
Kimi
论文信息