摘要
针对现有视频检索依赖嵌入扫描导致的计算低效与语义不对称问题,本文提出 MAVIS 多智能体框架。该框架将检索重构为协作推理过程:首先构建结构化语义库以解决粒度不匹配;检索时,规划器将复杂用户意图分解为原子子任务,调度专用智能体提名候选; crucially,引入逻辑感知辩论机制,通过严格否决协议协同剪枝逻辑不匹配项,筛选争议候选进行细粒度验证。实验表明,MAVIS 在无需特定任务微调的情况下,在多个基准上实现了具有竞争力的性能,提供了可扩展且可解释的替代方案。
AI 推荐理由
论文核心包含规划器分解意图及多智能体协作推理机制,属关键部分。
研究机构
广东海洋大学计算机与信息工程学院
论文信息