Information Extraction Agentic Workflow Zero-Shot Learning Medical NLP
摘要

从病理报告中提取信息对癌症分期至关重要,但关键数据嵌入在叙述性报告中,人工提取耗时且易错。传统监督方法依赖昂贵标注且存在级联失败风险。本研究开发了一种零样本代理工作流,评估了五个开源生成式大语言模型,旨在从肺切除病理报告中填充 13 个美国病理学家学会字段。通过与最先进的监督基线对比,最佳零样本模型在无特定任务训练下实现了 0.893 的 Micro-F1 值,准确提取了复杂关系。结果表明,开源零样本代理大语言模型是低成本提取肺部病理信息的有效方案。

AI 推荐理由

论文提出基于提示、规划、提取的代理工作流,规划是核心机制。

研究机构
Department of Health Outcomes and Biomedical Informatics, College of Medicine, University of Florida, Gainesville, FL, USA Division of Pulmonary, Critical Care and Sleep Medicine, Department of Medicine, College of Medicine, University of Florida, Gainesville, FL, USA College of Nursing, Florida State University, Tallahassee, FL, USA
论文信息
作者 Aman Pathak, Cheng Peng, Mengxian Lyu, Ziyi Chen, Reema Solan et al.
发布日期 2026-06-18
arXiv ID 2606.19852
相关性评分 8/10 (高度相关)