法律推理 智能体搜索 知识边界识别 强化学习 LLM
摘要

尽管大型推理模型(LRMs)在数学领域表现出卓越的逻辑能力,但其在法律领域的应用仍受到程序严谨性和法律逻辑遵循的严格要求限制。现有法律LLMs依赖于仅从内部参数知识中得出的“封闭式推理”,常常缺乏对自身知识边界的自我意识,导致自信却错误的结论。为了解决这一挑战,我们提出了Legal Reasoning with Agentic Search(LRAS),这是首个旨在将法律LLMs从静态和参数化的“封闭式思维”转变为动态和交互式的“主动查询”的框架。通过整合内省模仿学习和难度感知强化学习,LRAS使LRMs能够识别知识边界并处理法律推理的复杂性。实证结果表明,LRAS在深度推理任务中表现优于最先进的基线方法8.2-32%,特别是在需要可靠知识的任务中提升最为显著。

AI 推荐理由

论文涉及LLM在法律领域的推理改进,通过引入主动查询机制增强知识边界识别,与Agent Memory相关但非核心。

论文信息
作者 Yujin Zhou, Chuxue Cao, Jinluan Yang, Lijun Wu, Conghui He et al.
发布日期 2026-01-12
arXiv ID 2601.07296
相关性评分 6/10 (相关)