摘要
针对自然语言转 SQL(NL2SQL)在真实场景中因问题未明确、模式庞大及解释歧义导致的脆弱性问题,本文提出 SOMA-SQL 方法。该方法不依赖人工澄清,而是通过构建合成查询日志来锚定模式解释,并基于结构化歧义分类和候选差异执行针对性探测查询,以生成消歧证据用于最终 SQL 的选择与修复。实验表明,SOMA-SQL 在六个基准测试中平均执行准确率比最先进基线提高 13.0%,在歧义问题上提升高达 16.7%。
AI 推荐理由
论文核心在于通过主动探测和逻辑分析解决 NL2SQL 中的歧义,属于复杂的推理与消歧过程。
研究机构
Oracle AI
论文信息