摘要
从调查和其他集体评估中获取信息以减少对潜在群体属性的不确定性,需要在真实成本和数据缺失的情况下合理分配有限的提问资源。尽管大语言模型支持自然语言下的自适应、多轮交互,但现有方法大多固定受访者群体,未能根据部分或不完整响应调整受访者选择或利用人口结构。为弥补这一不足,本文研究了自适应群体信息获取问题,在明确的查询和参与预算下,代理自适应地选择问题和受访者。我们提出了一种理论支撑的框架,结合(i)基于LLM的预期信息增益目标来评分候选问题,以及(ii)异构图神经网络传播,用于聚合观察到的响应和参与者属性,以填补缺失响应并指导每轮受访者的选取。该闭环过程在查询少量具有信息量的个体的同时,通过结构相似性推断群体层面的响应。在三个现实世界的观点数据集上,我们的方法在受限预算下一致提升了群体层面的响应预测性能,包括在10%受访者预算下CES指标超过12%的相对提升。
AI 推荐理由
论文涉及基于LLM的自适应信息获取,与Agent Memory中的响应选择和信息聚合相关。
论文信息