摘要
针对自主 LLM 智能体因长程策略隐含于模型权重而导致失败及安全事后补救的问题,本文提出“遍历即策略”方法。该方法将沙箱执行日志蒸馏为单一可执行门控行为树(GBT),以树遍历替代无约束生成作为控制策略。节点编码状态条件动作宏,不安全轨迹触发确定性预执行门控。运行时轻量级遍历器匹配意图并执行宏,受阻时进行风险感知恢复。实验表明,该方法在提升成功率的同时显著降低违规率与成本,实现了安全鲁棒的任务规划。
AI 推荐理由
提出基于行为树的显式策略控制,核心解决长程任务规划与执行安全问题。
研究机构
清华大学
论文信息