Game Theory Information Seeking Robustness Nash Equilibrium
摘要

大语言模型在现实场景中常因信息缺失而难以完成任务,主动获取缺失信息的能力至关重要。现有方法多依赖简化假设,导致最坏情况性能下降。本文以“二十个问题”游戏评估 LLM 的信息搜索能力,形式化其对抗版本“战略语言搜索”问题,并将其建模为双人零和扩展式博弈。作者提出“思维博弈”框架,利用博弈论技术近似受限变体的纳什均衡策略。实验表明,该方法在所有测试设置中,相较于直接提示和启发式搜索,均一致提升了最坏情况下的性能表现。

AI 推荐理由

提出博弈论框架优化 LLM 信息搜索策略,显著提升最坏情况下的推理鲁棒性。

研究机构
新加坡国立大学计算机学院
论文信息
作者 Langyuan Cui, Chun Kai Ling, Hwee Tou Ng
发布日期 2026-02-02
arXiv ID 2602.01708
相关性评分 9/10 (高度相关)