Chain-of-Thought Knowledge Distillation E-commerce Search LLM Optimization
摘要

针对电商搜索中传统模型的局限,本文利用大语言模型结合思维链(CoT)提升相关性建模。现有方法多依赖单视角推理且蒸馏过程丢失推理结构。为此,作者提出新框架:教师模型采用多视角 CoT 生成多样化理由,结合监督微调与直接偏好优化构建强健推理器;学生模型通过引入潜在推理知识蒸馏,内化轻量级推理提取器以实现低延迟高效推理。离线实验与在线 A/B 测试表明,该方法显著提升了商业表现与用户体验。

AI 推荐理由

论文核心提出多视角思维链及潜在推理蒸馏,旨在增强模型推理能力并解决延迟问题。

研究机构
阿里巴巴国际数字商业集团,杭州,中国 浙江大学,杭州,中国
论文信息
作者 Baopu Qiu, Hao Chen, Yuanrong Wu, Changtong Zan, Chao Wei et al.
发布日期 2026-01-29
arXiv ID 2601.21611
相关性评分 9/10 (高度相关)