智能体系统 策略执行 信息流追踪 安全机制
摘要

基于LLM的智能体越来越多地部署在需要复杂授权策略的场景中,如客户服务协议、审批流程和数据访问限制等。将这些策略嵌入提示词中无法提供强制执行的保证。本文提出PCAS(用于智能体系统的策略编译器),通过确定性策略执行来解决这一问题。PCAS通过依赖图建模智能体系统状态,捕捉事件之间的因果关系,如工具调用、工具结果和消息。策略以Datalog衍生语言表达,声明式规则考虑了传递信息流和跨智能体来源。参考监控器拦截所有操作,在执行前阻止违规行为,实现独立于模型推理的确定性执行。PCAS将现有智能体实现与策略规范编译为符合策略的系统,无需特定安全重构。在三个案例研究中评估PCAS,包括针对提示注入防御的信息流策略、多智能体药物警戒系统中的审批流程以及客户服务的组织策略。在客户服务任务中,PCAS将前沿模型的策略合规性从48%提升至93%,且在受控运行中无策略违规。

AI 推荐理由

论文涉及Agent系统状态建模与信息流追踪,与Memory相关但非核心主题。

论文信息
作者 Nils Palumbo, Sarthak Choudhary, Jihye Choi, Prasad Chalasani, Mihai Christodorescu et al.
发布日期 2026-02-18
arXiv ID 2602.16708
相关性评分 6/10 (相关)