Finite-State Machine RTL Generation Logical Reasoning Benchmark Hardware Design
摘要

本文提出 LLM-FSM 基准,旨在评估大语言模型从自然语言规范中恢复有限状态机(FSM)行为并转化为正确寄存器传输级(RTL)代码的能力。该基准通过全自动化流水线构建,涵盖可配置状态数与约束转移结构,并利用形式化验证确保参考实现正确。实验表明,随着 FSM 复杂度增加,现有模型准确率显著下降。研究进一步证实,监督微调能有效泛化至分布外任务,而增加测试时计算量可提升推理可靠性。

AI 推荐理由

论文核心评估并提升 LLM 在有限状态机中的逻辑推理与状态依赖行为理解能力。

研究机构
斯坦福大学
论文信息
作者 Yuheng Wu, Berk Gokmen, Zhouhua Xie, Peijing Li, Caroline Trippel et al.
发布日期 2026-02-03
arXiv ID 2602.07032
相关性评分 9/10 (高度相关)