摘要
民事诉讼本质上是全生命周期过程,早期文书制约后续庭审。现有基准仅评估孤立子任务,模拟器缺乏跨阶段因果建模。本文提出 LegalWorld,基于 7.5 万份中国民事判决书,将诉讼建模为五阶段因果状态链。配套基础设施包含局部记忆、全局案件记忆及技能库,确保纠纷在全周期内的一致性。在此基础上构建 LongJud-Bench 基准,评估代理在连贯阶段中的能力。专家评分证实轨迹的程序忠实度与角色一致性,评估揭示不同模型在各阶段表现差异显著,无单一模型全面领先。
AI 推荐理由
论文核心在于构建跨阶段因果依赖的记忆架构,以解决法律代理中的长周期一致性问题。
研究机构
Fudan University
Northwest University of Political and Law
Shanghai Innovation Institute
论文信息