World Models Uncertainty Quantification Supply Chain Epistemic Grounding
摘要

针对供应链中 AI 代理存在的认知差距,即大语言模型缺乏物理基础而强化学习忽视语义约束的问题,本文提出 ReflectiChain。该方法构建了生成式供应链世界模型,将异构网络编码为具有物理守恒特性的六维图潜在空间,并采用双重循环学习机制分离认知不确定性与偶然不确定性。实验表明,该方法显著提升了理由一致性评分,在对抗性冲击下保持了高操作性,并展现出反脆弱行为,有效增强了复杂动态环境下的推理与决策能力。

AI 推荐理由

论文核心在于通过双重循环学习解决认知不确定性,提升 Agent 在复杂环境中的逻辑推理与决策一致性。

研究机构
School of Foreign Languages, Huazhong University of Science and Technology, Wuhan 430074, China
论文信息
作者 Jia Luo
发布日期 2026-06-09
arXiv ID 2606.10359
相关性评分 8/10 (高度相关)