摘要
针对电商搜索中传统模型的局限,本文利用大语言模型结合思维链(CoT)提升相关性建模。现有方法多依赖单视角推理且蒸馏过程丢失推理结构。为此,作者提出新框架:教师模型采用多视角 CoT 生成多样化理由,结合监督微调与直接偏好优化构建强健推理器;学生模型通过引入潜在推理知识蒸馏,内化轻量级推理提取器以实现低延迟高效推理。离线实验与在线 A/B 测试表明,该方法显著提升了商业表现与用户体验。
AI 推荐理由
论文核心提出多视角思维链及潜在推理蒸馏,旨在增强模型推理能力并解决延迟问题。
研究机构
阿里巴巴国际数字商业集团,杭州,中国
浙江大学,杭州,中国
论文信息