实时截止时间揭示了LLM战略对话中的时间意识失败

摘要

大型语言模型（LLMs）以离散时间逐词生成文本，而现实世界中的交流，如治疗会话和商业谈判，严重依赖于连续时间约束。当前的LLM架构和评估协议很少测试在实时截止时间下的时间意识。本文通过模拟严格截止时间下的代理谈判，研究LLM在时间敏感环境中的行为调整。在对照条件下，代理仅知道全局时间限制；在时间感知条件下，它们在每一轮中收到剩余时间更新。结果显示，在时间感知条件下，交易达成率显著提高（GPT-5.1为32% vs. 4%），接受提议的数量是对照条件的六倍，表明LLM难以内部追踪经过的时间。然而，这些LLM在基于回合的限制下几乎能完美达成交易（≥95%），说明问题在于时间跟踪而非战略推理。这些效应在不同谈判场景和模型中均得到复制，表明LLM存在系统性的时间意识缺失，这将限制其在许多时间敏感应用中的部署。

AI 推荐理由

论文探讨了LLM在时间感知上的不足，涉及其内部时间跟踪机制，与Agent Memory相关。

论文信息

作者 Neil K. R. Sehgal, Sharath Chandra Guntuku, Lyle Ungar

发布日期 2026-01-19

arXiv ID 2601.13206