摘要
大型推理模型(LRMs)擅长复杂推理任务,但冗长的输出常阻碍其效率。现有引导方法通常对隐藏表示应用单一全局向量,受限于线性表示假设。本文提出 FlowSteer,一种非线性引导方法,利用流匹配学习从冗长到简洁推理分布的完整变换速度场,实现基于输入的精确控制。实验表明,该方法在多个推理基准上相比主流基线显著提升了任务表现与令牌效率,证明了利用生成技术建模完整分布迁移是控制 LRMs 更有效且原则性的基础。
AI 推荐理由
论文核心研究大型推理模型的推理过程控制,提出新方法优化推理简洁性。
研究机构
LMU Munich
Amazon
论文信息