多智能体系统 社会记忆 幽默生成 LLM评估
摘要

先前的研究主要关注多轮交互和反馈在LLM写作中的应用,但评估仍集中在提示和局部反馈上,而在线社区的公共反馈则较少被研究。本文通过一个受控的多智能体沙盒环境,测试广播式社区讨论是否能提升单口喜剧写作的质量。在实验条件下,评论和观众的讨论内容被记录、过滤并存储为社会记忆,并在后续生成中被检索使用;而基线条件则不包含讨论。经过50轮(共250段配对独白)由五位专家根据A/B偏好和15项评分标准进行评估,结果显示讨论条件在75.6%的情况下表现更优,显著提升了创作技巧/清晰度(Δ = 0.440)和社会反应(Δ = 0.422),偶尔还增加了攻击性幽默。

AI 推荐理由

论文涉及社会记忆的存储与检索,用于改进生成效果,属于Agent Memory相关研究。

论文信息
作者 Shiwei Hong, Lingyao Li, Ethan Z. Rong, Chenxinran Shen, Zhicong Lu
发布日期 2026-02-16
arXiv ID 2602.14770
相关性评分 6/10 (相关)