divergent thinking tree-structured generation inference efficiency systematic exploration
摘要

语言模型通常顺序生成推理内容,难以在搜索过程中解耦无关的探索路径。本文提出树结构语言建模(TSLM),利用特殊令牌编码分支结构,使模型能在单次生成过程中产生并选择性扩展多条搜索路径。通过在包含成功与失败尝试的完整搜索树上进行训练,TSLM 学会了内部化系统探索机制,避免了对共享前缀的冗余重计算。该方法无需外部搜索所需的多重独立前向传播,实现了鲁棒的性能与卓越的推理效率,为开发语言模型的系统探索能力提供了高效的新范式。

AI 推荐理由

论文提出树结构语言建模以增强发散性思维和系统探索,核心解决推理过程中的路径解耦问题。

研究机构
NYU, KAIST AI
论文信息
作者 Doyoung Kim, Jaehyeok Doo, Minjoon Seo
发布日期 2026-01-30
arXiv ID 2601.22688
相关性评分 9/10 (高度相关)