PARSE：面向波斯语的开放域推理问答基准

Benchmark Persian NLP Reasoning Low-resource Languages

摘要

针对低资源语言缺乏高质量推理基准的问题，本文推出了 PARSE，首个波斯语开放域推理问答基准。该基准包含 10,800 个问题，涵盖多种推理类型与难度。通过受控的 LLM 生成流程及多阶段人工验证，确保了数据质量。实验表明，采用波斯语提示及结构化策略（如思维链）能显著提升模型表现，微调进一步优化了结果。PARSE 填补了波斯语推理研究空白，为低资源环境下的 LLM 评估奠定了基础。

AI 推荐理由

论文核心是构建波斯语推理问答基准，旨在评估和提升 LLM 的推理能力。

研究机构

因斯布鲁克大学

论文信息

作者 Jamshid Mozafari, Seyed Parsa Mousavinasab, Adam Jatowt

发布日期 2026-02-01

arXiv ID 2602.01246