多智能体系统 安全防护 感染传播 LLM
摘要

随着基于大语言模型(LLM)的多智能体系统(MAS)的快速发展,其引入了显著的安全漏洞,恶意影响可通过智能体间的通信病毒式传播。传统防护机制通常采用二元范式,严格区分良性智能体和攻击智能体,未能考虑被感染的智能体,即被攻击智能体转化的良性实体。本文提出了一种新的防御框架INFA-Guard,该框架明确识别并处理被感染智能体作为独立的威胁类别。通过利用感染感知检测和拓扑约束,INFA-Guard能够准确定位攻击源和感染范围。在修复过程中,INFA-Guard替换攻击者并恢复被感染智能体,避免恶意传播的同时保持拓扑完整性。大量实验表明,INFA-Guard实现了最先进的性能,平均将攻击成功率(ASR)降低了33%,并表现出跨模型鲁棒性、优越的拓扑泛化能力和高成本效益。

AI 推荐理由

论文涉及多智能体系统中的感染传播问题,与Agent Memory中的状态追踪和安全机制相关。

论文信息
作者 Yijin Zhou, Xiaoya Lu, Dongrui Liu, Junchi Yan, Jing Shao
发布日期 2026-01-21
arXiv ID 2601.14667
相关性评分 6/10 (相关)