Benchmark Persian NLP Reasoning Low-resource Languages
摘要

针对低资源语言缺乏高质量推理基准的问题,本文推出了 PARSE,首个波斯语开放域推理问答基准。该基准包含 10,800 个问题,涵盖多种推理类型与难度。通过受控的 LLM 生成流程及多阶段人工验证,确保了数据质量。实验表明,采用波斯语提示及结构化策略(如思维链)能显著提升模型表现,微调进一步优化了结果。PARSE 填补了波斯语推理研究空白,为低资源环境下的 LLM 评估奠定了基础。

AI 推荐理由

论文核心是构建波斯语推理问答基准,旨在评估和提升 LLM 的推理能力。

研究机构
因斯布鲁克大学
论文信息
作者 Jamshid Mozafari, Seyed Parsa Mousavinasab, Adam Jatowt
发布日期 2026-02-01
arXiv ID 2602.01246
相关性评分 9/10 (高度相关)