Kimi K2.5：视觉代理智能

Multi-modal Agent Task Decomposition Parallel Execution Agent Swarm

摘要

本文介绍了 Kimi K2.5，一种旨在推进通用代理智能的开源多模态代理模型。该模型强调文本与视觉的联合优化，采用联合预训练、零视觉监督微调及联合强化学习等技术。在此基础上，K2.5 提出了 Agent Swarm，这是一个自导向的并行代理编排框架，能将复杂任务动态分解为异构子问题并并发执行。评估显示，Kimi K2.5 在编码、视觉、推理及代理任务等多个领域达到最先进水平，且 Agent Swarm 将延迟降低了高达 4.5 倍。

AI 推荐理由

论文核心提出 Agent Swarm 框架，专注于动态任务分解与并发执行，是典型的规划能力研究。

研究机构

Kimi

论文信息

作者 Kimi Team, Tongtong Bai, Yifan Bai, Yiping Bao, S. H. Cai et al.

发布日期 2026-02-02

arXiv ID 2602.02276