基于大语言模型的抗幻觉安全规划

Security Planning Hallucination Mitigation Incident Response Digital Twin

摘要

大语言模型在安全管理任务（如事件响应规划）中潜力巨大，但其不可靠性和幻觉倾向仍是主要挑战。本文提出一种原则性框架，将 LLM 纳入迭代循环以支持决策：生成候选动作并检查其与系统约束及前瞻预测的一致性。若一致性低，则放弃该动作并通过数字孪生等外部反馈收集信息，利用上下文学习优化候选动作。理论证明该设计可通过调节一致性阈值控制幻觉风险，并确立了上下文学习的遗憾界。实验表明，该框架在四个数据集上将恢复时间缩短了 30%。

AI 推荐理由

论文核心提出安全规划框架，通过迭代循环生成和验证行动计划，直接解决规划中的幻觉问题。

研究机构

墨尔本大学帝国理工学院

论文信息

作者 Kim Hammar, Tansu Alpcan, Emil Lupu

发布日期 2026-02-05

arXiv ID 2602.05279