摘要
大语言模型在安全管理任务(如事件响应规划)中潜力巨大,但其不可靠性和幻觉倾向仍是主要挑战。本文提出一种原则性框架,将 LLM 纳入迭代循环以支持决策:生成候选动作并检查其与系统约束及前瞻预测的一致性。若一致性低,则放弃该动作并通过数字孪生等外部反馈收集信息,利用上下文学习优化候选动作。理论证明该设计可通过调节一致性阈值控制幻觉风险,并确立了上下文学习的遗憾界。实验表明,该框架在四个数据集上将恢复时间缩短了 30%。
AI 推荐理由
论文核心提出安全规划框架,通过迭代循环生成和验证行动计划,直接解决规划中的幻觉问题。
研究机构
墨尔本大学
帝国理工学院
论文信息