摘要
大型语言模型(LLMs)以离散时间逐词生成文本,而现实世界中的交流,如治疗会话和商业谈判,严重依赖于连续时间约束。当前的LLM架构和评估协议很少测试在实时截止时间下的时间意识。本文通过模拟严格截止时间下的代理谈判,研究LLM在时间敏感环境中的行为调整。在对照条件下,代理仅知道全局时间限制;在时间感知条件下,它们在每一轮中收到剩余时间更新。结果显示,在时间感知条件下,交易达成率显著提高(GPT-5.1为32% vs. 4%),接受提议的数量是对照条件的六倍,表明LLM难以内部追踪经过的时间。然而,这些LLM在基于回合的限制下几乎能完美达成交易(≥95%),说明问题在于时间跟踪而非战略推理。这些效应在不同谈判场景和模型中均得到复制,表明LLM存在系统性的时间意识缺失,这将限制其在许多时间敏感应用中的部署。
AI 推荐理由
论文探讨了LLM在时间感知上的不足,涉及其内部时间跟踪机制,与Agent Memory相关。
论文信息