摘要
针对现有代理推荐系统依赖稀疏交互且无法反映实时相互影响的问题,本文提出 RecNet,一种自进化偏好传播框架。该框架包含前向与后向两阶段:前向阶段通过集中式路由机制动态传播偏好更新,并结合个性化接收机制实现选择性吸收;后向阶段模拟多智能体强化学习,利用大模型进行信用分配与模块优化,推动传播策略的持续自我进化。实验表明该方法在建模偏好传播方面效果显著。
AI 推荐理由
论文提出自进化框架,利用反馈驱动机制实现策略持续优化与自我演进,核心聚焦自我进化。
研究机构
GSAL, Renmin University of China, Beijing, China
Department of Data Science, City University of Hong Kong, Hong Kong, China
Meituan, Beijing, China
论文信息