摘要
大型语言模型在开放域对话中表现优异,但在服务对话中因依赖噪声数据而效果不佳。为此,本文提出 SEAD(服务对话自进化智能体),一种无需大规模人工标注即可学习有效策略的框架。SEAD 将用户建模解耦为生成多样化用户状态以管理训练课程的“配置文件控制器”,以及专注于逼真角色扮演的“用户角色扮演模型”。该设计确保环境提供自适应训练场景。实验表明,SEAD 显著优于开源及闭源模型,任务完成率提升 17.6%,对话效率提升 11.1%。
AI 推荐理由
论文提出自进化框架,核心在于无需人工标注的自我策略学习与进化。
研究机构
Meituan
论文信息