思维博弈：利用博弈论实现大语言模型的鲁棒信息搜索

Game Theory Information Seeking Robustness Nash Equilibrium

摘要

大语言模型在现实场景中常因信息缺失而难以完成任务，主动获取缺失信息的能力至关重要。现有方法多依赖简化假设，导致最坏情况性能下降。本文以“二十个问题”游戏评估 LLM 的信息搜索能力，形式化其对抗版本“战略语言搜索”问题，并将其建模为双人零和扩展式博弈。作者提出“思维博弈”框架，利用博弈论技术近似受限变体的纳什均衡策略。实验表明，该方法在所有测试设置中，相较于直接提示和启发式搜索，均一致提升了最坏情况下的性能表现。

AI 推荐理由

提出博弈论框架优化 LLM 信息搜索策略，显著提升最坏情况下的推理鲁棒性。

研究机构

新加坡国立大学计算机学院

论文信息

作者 Langyuan Cui, Chun Kai Ling, Hwee Tou Ng

发布日期 2026-02-02

arXiv ID 2602.01708